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Introducción 


Las  sociedades  modernas  son  ricas  en  datos:  la  prensa  escrita,  la  televisión  y la 
radio,  Internet  y las  intranets  de  las  organizaciones  ofrecen  cantidades  inmen- 
sas de  datos  que  pueden  ser  procesados  y analizados.  Esto  convierte  a la  esta- 
dística en  una  ciencia  interesante  y útil  puesto  que  proporciona  estrategias  y 
herramientas  que  permiten  obtener  información  a partir  de  dichos  datos.  Ade- 
más, gracias  a la  evolución  de  la  tecnología  (ordenadores  y software  estadísti- 
co) hoy  en  día  es  posible  automatizar  gran  parte  de  los  cálculos  matemáticos 
asociados  al  uso  de  técnicas  estadísticas,  lo  que  permite  extender  su  uso  a un 
gran  rango  de  profesionales  en  ámbitos  tan  diversos  como  la  biología,  las  cien- 
cias empresariales,  la  sociología  o las  ciencias  de  la  información. 

La  práctica  de  la  estadística  requiere  aprender  a obtener  y explorar  los  datos  -tan- 
to numéricamente  como  mediante  gráficos-,  a pensar  sobre  el  contexto  de  los 
datos  y el  diseño  del  estudio  que  los  ha  generado,  a considerar  la  posible  in- 
fluencia de  observaciones  anómalas  en  los  resultados  obtenidos,  a discutir  la 
legitimidad  de  los  supuestos  requeridos  por  cada  técnica  y,  finalmente,  a va- 
lidar la  fiabilidad  de  las  conclusiones  derivadas  del  análisis.  La  estadística  requiere 
tanto  de  conocimientos  sobre  los  conceptos  y técnicas  empleados  como  de  la  su- 
ficiente capacidad  crítica  que  permita  evaluar  la  conveniencia  de  usar  unas  u 
otras  técnicas  según  el  tipo  de  datos  disponible  y el  tipo  de  información  que 
se  desea  obtener. 

En  este  módulo  inicial  de  la  asignatura,  se  examinan  los  datos  procedentes  de 
una  única  variable:  en  primer  lugar  se  explica  cómo  organizar  y resumir  dichos 
datos,  tanto  numérica  como  gráficamente  (estadística  descriptiva);  en  segun- 
do lugar,  se  introducen  los  conceptos  básicos  asociados  con  la  idea  de  proba- 
bilidad; finalmente,  se  presentan  algunos  modelos  matemáticos  que  permiten 
analizar  el  comportamiento  de  algunas  variables. 
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Objetivos 


Los  objetivos  académicos  que  se  plantean  en  este  módulo  son  los  siguientes: 

1.  Entender  la  importancia  de  la  estadística  en  la  sociedad  moderna. 

2.  Aprender  a organizar  y resumir  un  conjunto  de  datos  procedentes  de  una 
variable  mediante  gráficos,  tablas  de  frecuencias  y estadísticos  descriptivos. 

3.  Comprender  el  concepto  de  probabilidad  de  un  suceso  y descubrir  sus  prin- 
cipales propiedades  y aplicaciones. 

4.  Conocer  las  principales  distribuciones  estadísticas  que  se  usan  para  mode- 
lar el  comportamiento  de  variables  discretas  y continuas. 

5.  Saber  calcular  probabilidades  asociadas  a cada  una  de  las  distribuciones  in- 
troducidas. 

6.  Aprender  a usar  software  estadístico  o de  análisis  de  datos  como  instrumen- 
to básico  en  la  aplicación  práctica  de  los  conceptos  y técnicas  estadísticas. 


Estadística  descriptiva  univariante 


CC-BY-SA  • PID_001 61 058 


7 


Estadística  descriptiva  univariante 


1.  Introducción  a la  Estadística 


La  Estadística  es  la  ciencia  que  se  ocupa  de  obtener  datos  y procesarlos  para 
transformarlos  en  información.  Es,  por  tanto,  un  lenguaje  universal  amplia- 
mente utilizado  en  las  ciencias  sociales,  en  las  ciencias  experimentales,  en  las 
ciencias  de  la  salud  y en  las  ingenierías.  Las  Tecnologías  de  la  Información  y 
la  Comunicación  (TIC)  han  incrementado  notablemente  la  producción,  dise- 
minación y tratamiento  de  la  información  estadística.  En  particular,  Internet 
es  una  fuente  inagotable  de  datos  que  pueden  ofrecer  información  y,  a partir 
de  ella,  conocimiento.  Por  otra  parte,  la  constante  evolución  de  los  ordenado- 
res personales  y de  los  programas  informáticos  de  estadística  y análisis  de 
datos  posibilita  y facilita  el  análisis  de  grandes  cantidades  de  datos  mediante 
el  uso  de  técnicas  estadísticas  y de  minería  de  datos.  En  la  Sociedad  de  la  In- 
formación se  hace  pues  imprescindible  disponer  de  un  cierto  conocimiento 
estadístico  incluso  para  poder  comprender  e interpretar  correctamente  los  in- 
dicadores económicos  (IPC,  inflación,  tasa  de  desempleo,  Euribor,  etc.),  los  indi- 
cadores bibliométricos  (factor  de  impacto  de  una  revista,  cuartil  en  el  que  se  sitúa, 
vida  media  de  las  citas  recibidas,  etc.)  o los  indicadores  sociales  (esperanza  de 
vida,  índice  de  alfabetización,  índice  de  pobreza,  indicador  social  de  desarrollo 
sostenible,  etc.)  a los  que  frecuentemente  se  hace  referencia  en  los  medios  de 
comunicación. 


Nota 

Las  agencias  gubernamentales, 
como  el  Instituto  Nacional  de 
Estadística  (INE)  o el  Eurostat 
proporcionan  datos  sobre  casi 
cualquier  ámbito  socioeconó- 
mico. 

Software  estadístico 

En  la  actualidad  existen  exce- 
lentes programas  informáti- 
cos para  el  análisis  estadístico 
de  datos.  Algunos  ejemplos 
son:  MINITAB,  SPSS,  MS  Excel, 
SAS,  R,  S-Plus,  Statgraphics  o 
Statistica. 

El  campo  de  la  Estadística  se  puede  dividir  en  dos  grandes  áreas:  la  estadística 
descriptiva  y la  estadística  inferencial  (figura  1). 


Figura  1 . Estadística  descriptiva  y estadística  inferencial 
Población  de  individuos 


La  estadística  descriptiva  se  ocupa  de  la  obtención,  presentación  y descripción 
de  datos  procedentes  de  una  muestra  o subconjunto  de  una  población  de  in- 
dividuos. Por  su  parte,  la  estadística  inferencial  usa  los  resultados  obtenidos 
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mediante  la  aplicación  de  las  técnicas  descriptivas  a una  muestra  para  inferir 
información  sobre  el  total  de  la  población  a la  que  pertenece  dicha  muestra. 

Algunos  términos  básicos 

A lo  largo  de  este  material  se  usarán  abundantes  términos  estadísticos,  muchos 
de  ellos  bastante  conocidos.  A continuación  se  presentan  y revisan  algunos  de 
estos  términos  básicos  que  conviene  entender  bien: 

• Población:  colección  o conjunto  de  elementos  (individuos,  objetos  o su- 
cesos) cuyas  propiedades  se  desean  analizar.  Ejemplos:  (a)  los  estudiantes 
universitarios  de  un  país;  (b)  el  conjunto  de  periódicos  en  Internet;  (c)  el 
conjunto  de  revistas  indexadas  en  el  Science  Citation  Index  (SCI),  etc. 

• Muestra:  cualquier  subconjunto  de  elementos  de  la  población.  Ejemplos: 
(a)  los  estudiantes  de  una  determinada  universidad;  (b)  los  periódicos  en 
línea  centrados  en  aspectos  económicos;  (c)  las  revistas  indexadas  en  el  SCI 
de  una  determinada  editorial,  etc. 

• Muestra  aleatoria:  muestra  cuyos  elementos  han  sido  escogidos  de  forma 
aleatoria.  Ejemplos:  (a)  un  subconjunto  de  doscientos  estudiantes  escogi- 
dos al  azar  (mediante  el  uso  de  números  aleatorios)  de  entre  todos  los  ma- 
triculados en  universidades  de  un  país;  (b)  un  subconjunto  de  cincuenta 
periódicos  en  línea  escogidos  al  azar;  (c)  un  subconjunto  de  quince  revistas 
indexadas  en  el  SCI  escogidas  al  azar,  etc. 

• Marco  del  muestreo:  lista  que  contiene  aquellos  elementos  de  la  población 
candidatos  a ser  seleccionados  en  la  fase  de  muestreo.  No  necesariamente  co- 
incidirá con  toda  la  población  de  interés,  ya  que  en  ocasiones  no  será  posible 
identificar  a todos  los  elementos  de  la  población.  Ejemplos:  (a)  lista  de  todos 
los  estudiantes  matriculados  en  universidades  de  un  país  en  un  semestre  con- 
creto; (b)  relación  de  periódicos  en  línea  disponibles  en  un  momento  dado; 
(c)  lista  de  todas  las  revistas  indexadas  en  el  SCI  en  un  año  específico,  etc. 

• Variable  aleatoria:  característica  de  interés  asociada  a cada  uno  de  los  ele- 
mentos de  la  población  o muestra  considerada.  Ejemplos:  (a)  la  edad  de 
cada  estudiante;  (b)  el  número  de  visitas  diarias  que  recibe  cada  periódico 
en  línea;  (c)  el  factor  de  impacto  de  cada  revista,  etc. 

• Datos  u observaciones:  conjunto  de  valores  obtenidos  para  la  variable  de  in- 
terés en  cada  uno  de  los  elementos  de  la  muestra.  Ejemplos:  (a)  las  edades  re- 
gistradas son  ¡25,  23,  19,  28... j;  (b)  las  visitas  diarias  registradas  son  {1326, 
1792,  578,  982...};  (c)  los  factores  de  impacto  registrados  son  {2,3;  1,7;  8,2...}. 


Experimento:  estudio  en  la  que  el  investigador  controla  o modifica  expre- 
samente las  condiciones  del  mismo  con  la  finalidad  de  analizar  los  distin- 
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tos  patrones  de  respuesta  en  las  observaciones.  Ejemplos:  (a)  estudiar  cómo 
varían  las  calificaciones  de  un  grupo  de  estudiantes  según  dispongan  o no 
de  ordenadores  con  acceso  a Internet  en  las  aulas;  (b)  estudiar  cómo  varía 
el  número  de  visitas  a un  periódico  en  línea  según  se  opte  o no  por  incluir 
noticias  sensacionalistas  en  su  portada;  (c)  estudiar  cómo  varía  el  factor  de 
impacto  de  un  grupo  de  revistas  según  éstas  se  incluyan  o no  en  una  base 
de  datos  de  reconocido  prestigio,  etc. 

• Inspección  o encuesta:  estudio  en  el  que  el  investigador  no  pretende  mo- 
dificar las  condiciones  de  la  muestra  con  respecto  a la  variable  de  interés 
sino  simplemente  obtener  los  datos  correspondientes  a unas  condiciones 
estándar.  Ejemplos:  (a)  registrar  las  calificaciones  de  los  estudiantes  de  un 
rnáster  determinado;  (b)  realizar  una  encuesta  a los  lectores  de  un  periódico 
en  línea;  (c)  obtener  el  factor  de  impacto  asociado  a cada  una  de  las  revistas 
de  una  muestra,  etc. 

• Parámetro:  valor  numérico  que  sintetiza  alguna  propiedad  determinada 
de  la  población.  Los  parámetros  se  asocian  a toda  la  población  y suelen  re- 
presentarse con  letras  del  alfabeto  griego  como  p (mu),  a (sigma),  etc.  Ejem- 
plos: (a)  la  edad  media  de  todos  los  estudiantes  universitarios  de  un  país; 
(b)  el  número  máximo  de  visitas  diarias  recibido  por  algún  periódico  en  lí- 
nea; (c)  el  rango  o diferencia  entre  el  mayor  y el  menor  factor  de  impacto 
del  conjunto  de  revistas  indexadas  en  el  SCI,  etc. 

• Estadístico:  valor  numérico  que  sintetiza  alguna  propiedad  determinada 
de  una  muestra.  Los  estadísticos  se  asocian  a una  muestra  y se  suelen  repre- 
sentar por  letras  del  alfabeto  latino  como  x , s,  etc.  Ejemplos:  (a)  la  edad 
media  de  los  estudiantes  de  una  muestra  aleatoria;  (b)  el  número  máximo 
de  visitas  diarias  recibidas  por  algún  periódico  deportivo  en  línea;  (c)  el 
rango  o diferencia  entre  el  mayor  y el  menor  factor  de  impacto  de  las  revis- 
tas de  una  editorial,  etc. 

• Variable  cualitativa  o categórica:  variable  que  categoriza  o describe  cualita- 
tivamente un  elemento  de  la  población.  Suele  ser  de  tipo  alfanumérico,  pero 
incluso  en  el  caso  en  que  sea  numérica  no  tiene  sentido  usarla  en  operaciones 
aritméticas.  Ejemplos:  (a)  el  teléfono  o el  correo  electrónico  de  un  estudiante; 
(b)  la  dirección  IP  de  un  periódico  en  línea;  (c)  el  ISSN  de  una  revista,  etc. 

• Variable  cuantitativa  o numérica:  variable  que  cuantifica  alguna  propie- 
dad de  un  elemento  de  la  población.  Es  posible  realizar  operaciones  aritmé- 
ticas con  ella.  Ejemplos:  (a)  el  importe  de  la  beca  que  recibe  un  estudiante; 
(b)  los  ingresos  que  genera  un  periódico  en  línea;  (c)  el  número  de  revistas 
publicadas  por  una  editorial,  etc. 


• Variable  cuantitativa  discreta:  variable  cuantitativa  que  puede  tomar  un 
número  finito  o contable  de  valores  distintos.  Ejemplos:  (a)  edad  de  un  es- 
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tudiante;  (b)  número  de  enlaces  a otras  fuentes  de  información  que  ofrece 
un  periódico  en  línea;  (c)  calificación  que  obtiene  una  revista  en  una  escala 
entera  de  1 a 5,  etc. 


• Variable  cuantitativa  continua:  variable  cuantitativa  que  puede  tomar 
un  número  infinito  (no  contable)  de  valores  distintos.  Ejemplos:  (a)  altura 
o peso  de  un  estudiante;  (b)  tiempo  que  transcurre  entre  la  publicación  de 
una  encuesta  en  línea  y el  instante  en  que  ya  la  han  completado  un  cente- 
nar de  internautas;  (c)  factor  de  impacto  (sin  redondear)  de  una  revista,  etc. 

• Distribución  de  una  variable:  en  sentido  amplio,  una  distribución  es  una 
tabla,  gráfico  o función  matemática  que  explica  cómo  se  comportan  o dis- 
tribuyen los  valores  de  una  variable,  es  decir,  qué  valores  toma  la  variable 
así  como  la  frecuencia  de  aparición  de  cada  uno  de  ellos.  Ejemplo:  dada 
una  muestra  aleatoria  de  revistas,  la  distribución  de  la  variable  "factor  de 
impacto  de  una  revista"  puede  representarse  mediante  una  tabla  de  fre- 
cuencias o mediante  una  gráfica  como  se  aprecia  en  la  figura  2.  Se  observa 
que  trescientas  cuarenta  y dos  de  las  revistas  consideradas  tienen  un  factor 
de  impacto  entre  0 y 1,  cuatrocientas  cincuenta  y dos  de  las  revistas  tienen 
un  factor  de  impacto  entre  1 y 2,  etc. 


Figura  2.  Distribución  de  una  variable  aleatoria 
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2.  Descripción  de  datos  mediante  tablas  y gráficos 


Cuando  se  dispone  de  un  conjunto  de  observaciones  procedentes  de  una 
muestra  conviene  hacer  un  primer  análisis  exploratorio  de  éstas  mediante  grá- 
ficos y tablas  que  ayuden  a interpretar  los  datos  y a extraer  información  de  los 
mismos.  Existen  diferentes  tipos  de  gráficos  que  pueden  usarse  en  esta  fase  ex- 
ploratoria y el  uso  de  unos  u otros  dependerá  en  gran  medida  del  tipo  de  datos 
de  los  que  se  disponga  (cualitativos  o cuantitativos),  así  como  de  la  informa- 
ción que  se  desee  visualizar.  En  este  apartado  se  presentaran  algunos  de  los 
gráficos  y tablas  más  habituales  para  la  descripción  de  datos  univariantes. 

Gráficos  y tablas  para  datos  cualitativos  o categóricos 

Si  se  dispone  de  datos  cualitativos  o categóricos,  pueden  sintetizarse  mediante 
una  tabla  que  recoja,  para  cada  categoría:  el  número  de  veces  que  aparece  (fre- 
cuencia absoluta),  el  porcentaje  de  apariciones  sobre  el  total  de  observaciones 
(frecuencia  relativa),  así  como  los  acumulados  de  ambos  valores.  La  tabla  1 
muestra  esta  información  para  la  variable  "número  de  hotspots  (conexiones 
wi-fi)  identificados  en  cada  comunidad  autónoma". 


Tabla  1 . Ejemplo  de  tabla  de  frecuencias  para  una  variable  categórica 


Comunidad 

autónoma 

Hotspots  por  comunidad  autónoma 

Frecuencia 

Frecuencia 

acumulada 

Frecuencia 

relativa 

Frec.  reí. 
acumulada 

Andalucía 

885 

885 

11,9% 

11,9% 

Aragón 

177 

1.062 

2,4% 

14,2% 

Asturias 

148 

1.210 

2,0% 

1 6,2% 

Cantabria 

164 

1.374 

2,2% 

1 8,4% 

Castilla-La  Mancha 

144 

1.518 

1,9% 

20,3% 

Castilla  y León 

302 

1.820 

4,0% 

24,4% 

Cataluña 

1.391 

3.211 

1 8,6% 

43,0% 

C.  Valenciana 

622 

3.833 

8,3% 

51,3% 

Extremadura 

137 

3.970 

1 ,8% 

53,2% 

Galicia 

516 

4.486 

6,9% 

60,1% 

1.  Baleares 

183 

4.669 

2,5% 

62,5% 

1.  Canarias 

151 

4.820 

2,0% 

64,6% 

La  Rioja 

126 

4.946 

1,7% 

66,3% 

Madrid 

1.776 

6.722 

23,8% 

90,0% 

Murcia 

160 

6.882 

2,1% 

92,2% 

Navarra 

153 

7.035 

2,0% 

94,2% 

País  Vasco 

430 

7.465 

5,8% 

100,0% 

Totales 

7.465 

100,0% 

Estadística  descriptiva  univariante 


Datos  univariantes 


Los  datos  univariantes  son  los 
que  provienen  de  una  única 
variable.  En  algunos  casos,  los 
datos  pueden  proceder  de  dos 
o más  variables  y,  entonces,  se 
usa  la  expresión  bivariante 
(si  se  trata  de  dos  variables) 
o multivariante  (si  se  conside- 
ran más  de  dos). 


Nota 


Observad  que  la  frecuencia 
acumulada  se  obtiene  sólo 
con  ir  acumulando  frecuencias 
anteriores. 
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Además  de  mediante  una  tabla  de  frecuencias,  suele  ser  habitual  representar 
datos  categóricos  mediante  el  uso  de  gráficos  circulares  (figura  3)  o bien  me- 
diante diagramas  de  barras  (figura  4). 


Figura  3.  Ejemplo  de  gráfico  circular  para  una  variable  categórica 


Porcentaje  de  hotspots  por  comunidades  autónomas 


La  Rioja 
1,7% 

I.  Canarias 

2,0% 

I. 

2,5% 


VJC1IK.IC1 


Extremadura 


Madrid 

23,8% 


País  Vasco 


Andalucía 
9% 


Aragón 
2,4% 


Asturias 

2,0% 

Cantabria 
2,2% 


Castilla  - La  Mancha 
1,9% 


Castilla  y León 
4,0% 


Cataluña 
1 8,6% 


Comunidad  Valenciana 
8,3% 


Navarra 

2,0% 


Murcia 

2,1% 


1,8% 


Figura  4.  Ejemplo  de  diagrama  de  barras  para  una  variable  categórica 


Número  de  hotspots  por  comunidad  autónoma 


Este  tipo  de  gráficos  pueden  crearse  fácilmente  con  cualquier  programa  esta- 
dístico o de  análisis  de  datos  (p.  ej.:  Minitab,  MS  Excel,  SPSS,  etc.).  La  figura  5 
muestra  los  pasos  básicos  para  generar  un  gráfico  circular  (pie  chart)  con  Mini- 
tab. La  generación  de  un  diagrama  de  barras  (bar  chart ) se  consigue  de  forma 
similar,  al  igual  que  ocurre  con  la  mayoría  de  los  gráficos  que  se  presentan  en 
este  apartado. 
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Figura  5.  Pasos  a seguir  para  la  generación  de  un  gráfico  circular  con  Minitab 

fraoh  EStor  Iools  Wndow  Help 
Scdttefptot... 
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W Boxptot... 
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IróvjduaJ  Valué  Ptot... 

K Une  Ptot... 

IlD  BerChart... 


Pie  Chart... 


3] 


ñeOptions...  | Labcb...  | 4 3 
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* 
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146 

4 

Cantabria 

164 

5 

Castilla-La  Mancha 

144 

6 

Castilla  y León 

302  t 

7 

Cataluña 

1391 

8 

Comunidad  Valenciana 

622 

9 

Extremadura 

137 

10 

etc 

Pie  Chart 


C2  Hot  spots  Chart  counts  of  uníque  valúes 

(•  Chart  valúes  from  a table 

Categoncal  variable: 

| CCAA 

Sunmary  variables: 

I Hotspots 


Un  gráfico  que  también  suele  usarse  bastante  para  describir  datos  cualita- 
tivos es  el  llamado  diagrama  de  Pareto.  Este  gráfico  está  compuesto  por:  (a) 
un  diagrama  de  barras  en  el  que  las  categorías  están  ordenadas  de  mayor  a 
menor  frecuencia  y (b)  una  línea  que  representa  la  frecuencia  relativa  acu- 
mulada (figura  6). 


Figura  6.  Diagrama  de  Pareto  sobre  las  causas  de  abandono  de  un  curso 

Causas  de  abandono  del  curso  académico 


Frecuencia 

48 

39 

13 

9 

6 

5 

4 

2 

Porcentaje 

38,1 

31,0 

10,3 

7,1 

4,8 

4,0 

3,2 

1,6 

Cum.  % 

38,1 

69,0 

79,4 

86,5 

91,3 

95,2 

98,4 

100,0 

Pasos  a seguir 


Una  vez  introducidos  los  datos 
en  el  programa  (1),  se  sigue  la 
ruta  C raph  > Pie  Chart  (2)  y se 
seleccionan  las  variables  en  la 
ventana  correspondiente  (3). 


Nota 


Las  capturas  de  pantalla  de 
Minitab  corresponden  a la  ver- 
sión 15  de  este  programa.  Es 
posible  que  otras  versiones 
ofrezcan  ligeras  diferencias  en 
los  menús  y ventanas,  aunque 
básicamente  el  proceso  será  el 
mismo.  Para  obtener  más  deta- 
lles sobre  las  opciones  disponi- 
bles, siempre  es  posible 
consultar  la  ayuda  en  línea  del 
programa  o bien  alguno  de  los 
numerosos  manuales  de  uso 
que  se  pueden  encontrar  en 
Internet. 


Diagrama  de  Pareto 


Para  generar  un  diagrama  de 
Pareto  en  Minitab  hay  que  usar 
la  ruta  Stat  > Quality  Tools. 
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Los  diagramas  de  Pareto  son  muy  útiles  para  detectar  cuándo  un  porcentaje 
reducido  de  categorías  (p.  ej.:  un  20%  de  las  categorías)  "acapara"  o repre- 
senta un  porcentaje  alto  de  observaciones  (p.  ej.:  un  80%  de  los  datos).  Es- 
tos fenómenos  de  excesiva  representatividad  por  parte  de  unas  pocas 
categorías  suelen  darse  con  frecuencia  en  contextos  socioeconómicos  (p.  ej.: 
un  porcentaje  reducido  de  los  ciudadanos  de  un  país  acapara  un  alto  por- 
centaje de  la  renta),  educativos  (p.  ej.:  un  porcentaje  reducido  de  causas  ge- 
neran la  mayor  parte  de  los  abandonos  del  curso)  o de  ingeniería  de  la 
calidad  (p.  ej.:  un  alto  porcentaje  de  fallos  son  debidos  a un  número  muy 
reducido  de  causas).  Identificar  aquellas  pocas  categorías  que  representan 
una  gran  parte  del  porcentaje  total  puede  servir  para  corroborar  ciertos  des- 
equilibrios distributivos  -como  una  distribución  poco  equilibrada  de  las 
rentas  en  un  país  o de  los  sueldos  en  una  empresa-,  o para  proporcionar 
pistas  sobre  los  principales  factores  de  causa  de  un  problema  -como  el  alto 
nivel  de  abandono  de  un  curso  o un  elevado  nivel  de  fallos  en  un  servicio 
o producto-. 

Gráficos  y tablas  para  datos  cuantitativos 

En  el  caso  de  datos  cuantitativos,  su  representación  gráfica  o mediante  tablas 
permite  apreciar  la  forma  de  su  distribución  estadística,  es  decir,  la  forma  en 
que  se  comporta  la  variable  de  interés  (cuáles  son  los  valores  medios  o centra- 
les, cuáles  son  los  valores  más  habituales,  cómo  varía,  cómo  de  dispersos  son 
los  valores,  si  muestra  algún  patrón  de  comportamiento  especial,  etc.). 

Uno  de  los  gráficos  más  sencillos  de  elaborar  es  el  llamado  gráfico  de  puntos 
(dotplot).  Se  trata  de  un  gráfico  en  el  que  cada  punto  representa  una  o más  ob- 
servaciones. Los  puntos  se  apilan  uno  sobre  otro  cuando  se  repiten  los  valores 
observados  (figura  7). 

Figura  7.  Gráfico  de  puntos  para  las  calificaciones  de  un  curso 

Calificaciones  de  un  curso 

• • • • 

• • ••••••••••  • 

• ! a • • nn»^ • • • * • *_l 

1,2  2,4  3,6  4,8  6,0  7,2  8,4 

Calificaciones 


Un  gráfico  similar,  aunque  algo  más  elaborado  y con  una  orientación  trans- 
puesta de  los  ejes,  es  el  llamado  diagrama  de  tallos  y hojas  ( stem-and-leaf ). 
En  él  también  se  representan  los  valores  observados  pero  usando  los  pro- 
pios valores  numéricos  en  lugar  de  puntos,  lo  que  proporciona  un  mayor 
nivel  de  detalle.  La  figura  8 muestra  un  ejemplo  de  gráfico  de  tallos  y hojas 
para  los  mismos  datos  empleados  en  la  figura  7.  Se  observa  que  el  gráfico 
se  ha  construido  a partir  de  una  muestra  de  cincuenta  calificaciones  y que 
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se  ha  usado  una  unidad  de  hoja  ( leaf)  de  0,1.  Esto  significa  que  la  segunda 
columna  del  gráfico  representa  la  parte  entera  de  la  calificación,  mientras 
que  cada  uno  de  los  números  situados  a su  derecha  representa  la  parte  de- 
cimal de  una  observación  con  dicha  parte  entera.  Así,  se  pueden  leer  las  si- 
guientes calificaciones  por  orden  de  menor  a mayor:  1,4,  2,9,  3,0,  3,5,  3,9, 
4,0,  4,3,  etc. 


Figura  8.  Gráfico  de  hojas  y tallos  para  las  calificaciones  de  un  curso 
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Atención 

Cabe  destacar  que  en  un  gráfi- 
co de  tallos  y hojas  los  datos  se 
apilan  de  Izquierda  a derecha 
en  lugar  de  arriba  abajo  como 
ocurre  con  el  gráfico  de 
puntos. 

Cuando  las  observaciones  generan  un  número  elevado  de  valores  distintos,  re- 
sulta recomendable  agruparlos  en  clases  o intervalos  disjuntos  de  igual  tama- 
ño. De  ese  modo,  cada  observación  se  clasifica  en  una  clase  o intervalo  según 
su  valor.  La  tabla  2 muestra  un  ejemplo  de  tabla  de  frecuencias  en  el  que  se 
han  agrupado  los  datos  en  intervalos.  La  frecuencia  de  cada  intervalo  viene  de- 
terminada por  el  número  de  observaciones  cuyos  valores  están  en  dicho  inter- 
valo. La  marca  de  clase  representa  el  valor  medio  del  intervalo. 


Tabla  2.  Ejemplo  de  tabla  de  frecuencias  agrupadas  usando  Intervalos 


Intervalo 

Marca  de  clase 

Frecuencia 

Frecuencia  relativa 

[0,  2) 

1 

12 

8,1% 

[2,  4) 

3 

23 

1 5,5% 

[4,  6) 

5 

67 

45,3% 

[6,  8) 

7 

31 

20,9% 

[8,  1 0) 

9 

15 

10,1% 

Totales 

148 

100,0% 

Un  gráfico  que  utiliza  también  intervalos  para  agrupar  los  datos  a represen- 
tar es  el  histograma.  El  histograma  muestra  la  frecuencia  (absoluta  o relati- 
va) de  cada  clase,  lo  que  permite  visualizar  de  forma  aproximada  la 
distribución  de  los  datos  (figura  9).  Sin  embargo,  hay  que  tener  presente 
que  la  forma  final  del  histograma  puede  variar  bastante  según  el  número 
de  intervalos  que  se  definan  para  agrupar  los  datos,  lo  que  a veces  no  per- 
mite apreciar  correctamente  la  forma  exacta  de  la  distribución  estadística 
que  siguen  las  observaciones. 


Nota 

Una  regla  habitual  es  definir 
úñ  clases  o intervalos,  siendo 
n el  número  de  observaciones 
disponibles. 
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Figura  9.  Histograma  de  una  distribución  aproximadamente  normal 

Evaluación  de  la  calidad  de  un  servicio  (O  a 10) 


Calificación  de  los  consumidores 


La  figura  9 muestra  un  histograma  con  forma  de  campana:  es  una  forma  bas- 
tante simétrica,  que  presenta  una  mayor  altura  en  la  parte  central  y disminuye 
paulatinamente  en  las  "colas"  o extremos.  Esta  forma  es  bastante  habitual  y 
suele  caracterizar  el  comportamiento  de  muchas  variables  (p.  ej.:  notas  numé- 
ricas en  un  examen,  peso  o altura  de  individuos,  temperaturas  diarias,  etc.). 
Sin  embargo,  también  es  habitual  encontrarse  con  variables  que  muestran  pa- 
trones de  comportamientos  completamente  distintos.  Por  ejemplo,  la  figura 
10  muestra  un  histograma  en  el  que  se  aprecia  una  distribución  más  "unifor- 
me" u homogénea  de  los  datos,  mientras  que  la  figura  11  muestra  un  histogra- 
ma en  el  que  se  aprecia  una  distribución  asimétrica  o "sesgada"  de  los  mismos. 

Figura  10.  Histograma  de  una  distribución  aproximadamente  uniforme 


Duración  del  vuelo  entre  Valencia  y Francfort 


Minutos 
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3.  Descripción  de  datos  mediante  estadísticos 


Dado  un  conjunto  de  n datos  u observaciones,  xu  x2,  ...,  xn,  asociadas  a una  va- 
riable de  interés  X,  suele  ser  útil  sintetizar  algunas  de  sus  principales  propiedades 
en  unos  pocos  valores  numéricos.  Los  estadísticos  descriptivos  son,  precisamente, 
estos  valores  numéricos  capaces  de  proporcionar  información  a partir  del  conjun- 
to de  las  observaciones.  Estos  estadísticos  resultan  muy  útiles  a la  hora  de  enten- 
der el  comportamiento  de  los  datos,  ya  que  un  simple  valor  numérico  es  capaz  de 
describir  propiedades  tan  relevantes  como,  por  ejemplo,  el  valor  promedio  del 
conjunto  de  datos,  el  valor  máximo,  el  valor  mínimo,  el  valor  que  se  repite  con 
más  frecuencia,  un  índice  de  dispersión  o variabilidad,  etc. 

Como  ya  se  comentó  anteriormente,  estos  estadísticos  hacen  referencia  a una 
muestra  de  observaciones  y suelen  representarse  mediante  letras  del  alfabeto 
latino  (3c,  s,  etc.),  lo  que  permite  distinguirlos  claramente  de  sus  parámetros 
asociados  que  sintetizan  propiedades  de  toda  la  población  y se  representan 
mediante  letras  griegas  (p,  a,  etc.).  Básicamente  pueden  distinguirse  dos  gru- 
pos de  estadísticos  descriptivos:  (a)  los  de  centralización,  que  proporcionan  in- 
formación sobre  cuáles  son  los  valores  "centrales"  del  conjunto  de  datos  (p.  ej.: 
el  valor  promedio  de  los  datos)  y (b)  los  de  dispersión,  que  explican  cómo  se 
sitúan  y varían  los  datos  con  respecto  a los  valores  "centrales"  (p.  ej.:  el  rango 
o diferencia  entre  el  valor  máximo  y el  valor  mínimo  de  los  datos). 

Estadísticos  de  centralización 

A continuación  se  presentan  los  estadísticos  de  centralización  más  usados  ha- 
bitualmente: 

• Media  (mean):  la  media  (también  conocida  por  valor  promedio  o valor  es- 
perado) de  un  conjunto  de  observaciones  muéstrales  se  representa  con  el 
símbolo  x.  Intuitivamente,  la  media  simboliza  el  "centro  de  masas"  o 
"punto  de  equilibrio  central"  del  conjunto  de  datos  considerado.  El  pará- 
metro asociado,  la  media  poblacional,  se  representa  por  p.  Para  calcular  la 
media  de  un  conjunto  de  datos  se  usa  la  siguiente  expresión: 


_ X1+X2+...  + Xn 

n 


xi 


Ejemplo:  la  media  de 
-6+3+8+6+427 


los  cinco  datos 
-5,4 


siguientes  {6,  3,  8,  6,  4}  es 


Web 


Recordar  que  la  World  Wide 
Web  (p.  ej.,  Wikipedia,  etc.) 
es  una  excelente  fuente  de 
consulta  para  ampliar  los 
conceptos  y definiciones 
estadísticas  que  se 
proporcionan  en  este  y otros 
módulos.  Un  recurso 
especialmente  interesante, 
por  cuanto  ofrece  una  visión 
muy  completa  de  conceptos 
y técnicas  estadísticas,  es  el 
libro  en  línea  de  StatSoft 
http://www.statsoft.com/ 
textbook/. 


Nota 


Recordar  que  los  símbolos 
P y a se  pronuncian  como 
"mu"  y "sigma",  respectiva- 
mente. La  pronunciación  de 
otros  símbolos  del  alfabeto 
griego  se  puede  consultar, 
p.  ej.,  en  Wlkepedla. 


Media  muestral 


Recordar  que  la  media  mues- 
tral es  un  estadístico  que  hace 
referencia  al  "centro  de  masas" 
de  los  datos  de  una  muestra 
(subconjunto  de  la  población), 
mientras  que  la  media  pobla- 
cional es  un  parámetro  que  re- 
presenta el  "centro  de  masas" 
de  toda  la  población. 


Mediana  (median):  la  mediana  de  un  conjunto  de  observaciones  muéstra- 
les suele  representarse  con  el  símbolo  x . En  el  caso  de  una  población,  el 
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parámetro  mediana  se  denota  con  M.  Una  vez  se  ordenan  todos  los  datos 
de  menor  a mayor,  la  mediana  es  aquel  valor  que  deja  a su  izquierda  la  mi- 
tad de  las  observaciones  (es  decir,  es  aquel  valor  tal  que  el  número  de  ob- 
servaciones más  pequeñas  que  él  coincide  con  el  número  de  observaciones 
mayores  que  él).  Los  pasos  para  calcular  la  mediana  son:  (1)  ordenar  los  da- 
tos de  menor  a mayor,  (2)  calcular  la  posición  i que  ocupa  la  mediana  en 

el  conjunto  ordenado  de  datos,  i = y (3)  seleccionar  la  observación  x¡ 

(la  que  ocupa  la  posición  determinada  en  el  paso  anterior).  Cabe  observar 
que  si  el  número  de  datos  n es  impar  (p.  ej.:  n = 5),  la  posición  i será  un  valor 
entero  (p.  ej.:  i = 3)  que  corresponderá  con  un  valor  concreto,  x¡,  del  con- 
junto de  datos.  Sin  embargo,  si  n es  par  (p.  ej.:  n = 6),  la  posición  i será  un 
número  no  entero  (p.  ej.:  i = 3,5),  en  cuyo  caso  la  mediana  vendrá  dada  por 
el  promedio  de  los  dos  valores  que  ocupan  las  posiciones  enteras  más  cer- 
canas a i (en  este  caso  por  el  promedio  de  los  valores  que  ocupan  las  posi- 
ciones 3 y 4). 


Ejemplo:  dado  el  conjunto  de  ocho  datos  {5,  11,  7,  8,  10,  9,  6,  9¡,  lo  prime- 
ro es  ordenarlos  de  menor  a mayor,  con  lo  que  se  obtiene  la  serie  {5,  6,  7, 
8,  9,  9,  10,  11};  ahora,  la  posición  de  la  mediana  vendrá  dada  por 
0,1 

i = = 4,5,  es  decir,  la  mediana  estará  entre  los  valores  que  ocupan  las 

posiciones  4 y 5,  por  lo  que  se  calcula  el  promedio  de  ambos  para  dar  el  va- 


lor de  la  mediana,  es  decir:  x = 


8 + 9 
2 


8,5. 


Es  importante  destacar  que  la  media  es  muy  sensible  a la  existencia  de  va- 
lores extremos  ( ontliers ),  es  decir,  la  inclusión  o no  de  un  valor  que  esté 
muy  alejado  del  resto  de  los  datos  puede  cambiar  considerablemente  el  va- 
lor resultante  de  la  media.  Por  el  contrario,  la  mediana  se  ve  mucho  menos 
afectada  por  la  presencia  de  dichos  valores,  lo  que  significa  que  la  mediana 
es  un  "centro"  más  estable  que  la  media  en  el  sentido  de  que  se  ve  menos 
afectado  por  la  presencia  de  valores  extremos  en  los  datos. 

• Moda  ( tnode ):  la  moda  de  un  conjunto  de  datos  es  el  valor  que  más  veces 
se  repite  (el  de  mayor  frecuencia). 

Ejemplo:  la  moda  de  la  serie  de  datos  (6,  3,  4,  8,  9,  6,  6,  3,  4}  es  6,  puesto 
que  es  el  valor  que  más  veces  aparece  en  la  serie. 

Estadísticos  de  dispersión 

Se  presentan  ahora  los  principales  estadísticos  de  dispersión  que,  como  se  ha 
comentado  anteriormente,  proporcionan  información  sobre  la  variabilidad 
del  conjunto  de  datos: 
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• Rango  ( range ):  el  rango  de  un  conjunto  de  datos  es  la  diferencia  entre  el 
valor  máximo  y el  mínimo  de  los  mismos. 

Ejemplo:  dado  el  conjunto  de  datos  |2,  3,  8,  3,  5,  1,  -8¡,  su  rango  es 
8 - (-8)  = 16 


• Varianza  muestral  ( sample  variance ):  la  varianza  de  una  muestra  se  repre- 
senta por  el  símbolo  sz.  En  el  caso  de  una  población,  el  parámetro  varianza 
se  representa  con  el  símbolo  a2.  La  varianza  muestral  será  mayor  cuanto 
mayor  sean  las  diferencias  entre  cada  una  de  las  observaciones  x¡  y la  media 
de  los  datos  x,  en  concreto: 


2 [Xl-xf  +{x2-xf  + ...  + {xn-xf  1 " -*2 

n ~ 1 »-léí(  ' } 

Esto  significa  que  la  varianza  es  una  medida  de  la  dispersión  de  los  datos 
con  respecto  a su  media,  es  decir,  cuando  menor  sea  la  varianza,  tanto 
más  agrupados  estarán  los  datos  alrededor  de  su  valor  promedio.  Por  el 
contrario,  cuanto  mayor  sea  la  varianza,  tanto  más  dispersos  estarán  los 
datos. 

Ejemplo:  la  varianza  muestral  de  la  serie  de  5 datos  {6,  3,  8,  5,  3¡  es: 


s 


2 


(6  - 5)2  + (3  - 5)2  + (8  - 5)2  + (5  - 5)2  + (3  - 5)2  _ ^ g 


• Desviación  estándar  ( standard  deviation ):  la  desviación  estándar  (o  típi- 
ca) de  una  muestra  se  representa  con  el  símbolo  s,  mientras  que  la  desvia- 
ción estándar  de  una  población  se  representa  con  c.  La  desviación  estándar 
es  la  raíz  cuadrada  positiva  de  la  varianza,  esto  es:  s = V?  (o,  dicho  de  otro 
modo,  la  varianza  es  el  cuadrado  de  la  desviación  estándar). 


Ejemplo:  para  los  datos  del  ejemplo  anterior,  s = ^4,5  =2,1 


Al  igual  que  ocurría  con  la  varianza,  a mayor  desviación  estándar  más  dis- 
persión en  los  datos  y viceversa. 


• Cuartiles  ( quartiles ):  en  un  conjunto  de  n observaciones  ordenadas  de  menor 
a mayor  valor,  se  pueden  considerar  tres  valores  numéricos  concretos  llama- 
dos cuartiles  que  dividen  el  conjunto  en  cuatro  partes,  cada  una  de  ellas  con- 
teniendo una  cuarta  parte  de  las  observaciones  (figura  12).  El  primer  cuartil, 
Qi,  es  el  valor  que  deja  la  cuarta  parte  de  los  datos  ordenados  a su  izquierda  (es 
decir,  un  25%  de  los  datos  muestran  valores  inferiores  a él  y un  75%  de  los  da- 
tos muestran  valores  superiores  a él).  Por  su  parte,  el  segundo  cuartil,  Q2,  es 
aquel  valor  que  deja  la  mitad  de  los  datos  ordenados  a su  izquierda  (es  decir, 
un  50%  de  los  datos  muestran  valores  inferiores  a él  y un  50%  de  los  datos 
muestran  valores  superiores  a él).  Finalmente,  el  tercer  cuartil,  Q3,  es  aquel  va- 
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lor  que  deja  tres  cuartas  partes  de  los  datos  ordenados  a su  izquierda  (es  decir, 
un  75%  de  los  datos  muestran  valores  inferiores  a él  y un  25%  de  los  datos 
muestran  valores  superiores  a él). 


Figura  12.  Cuartiles  de  un  conjunto  ordenado  de  datos 


Valor  de  la  variable 


Obsérvese  que,  en  realidad,  el  cuartil  segundo  o Q2  coincide  con  el  con- 
cepto de  mediana  presentado  anteriormente.  Los  cuartiles  son  muy  úti- 
les a la  hora  de  clasificar  una  observación  en  una  determinada  franja  del 
conjunto  de  datos,  por  ejemplo,  si  la  observación  es  inferior  a Q1  signi- 
fica que  ésta  se  encuentra  situada  entre  el  25%  de  valores  más  bajos;  si 
la  observación  es  superior  a Q3  significa  que  está  situada  entre  el  25% 
de  valores  más  altos,  etc. 

• Rango  intercuartílico  (Ínter -quartilic  range ):  este  rango  suele  repre- 
sentarse como  IQR  y es  simplemente  la  diferencia  entre  el  tercer  cuartil 
y el  primer  cuartil,  es  decir:  IQR  = Q3  - Q3.  El  rango  intercuartílico  indi- 
ca el  espacio  que  ocupan  el  50%  de  las  observaciones  "centrales” 
(figura  12),  por  lo  que,  de  forma  similar  a lo  que  ocurría  con  la  varianza, 
da  una  medida  de  la  dispersión  de  los  datos  (a  mayor  IQR  mayor  disper- 
sión y viceversa). 

Obtención  de  estadísticos  descriptivos  mediante  programas  informáticos 

En  la  práctica,  es  habitual  utilizar  algún  programa  estadístico  o de  análisis 
de  datos  para  calcular  los  estadísticos  anteriores  e incluso  algunos  estadís- 
ticos adicionales  que  proporcionen  información  sobre  el  conjunto  de  da- 
tos. En  la  figura  13  se  muestran  los  pasos  básicos  necesarios  para  obtener 
los  principales  estadísticos  descriptivos  con  Minitab.  El  output  del  progra- 
ma, para  un  ejemplo  con  cincuenta  observaciones,  se  muestra  en  la  figura 
14.  Por  su  parte,  la  figura  15  muestra  una  serie  de  estadísticos  descriptivos 
generados  con  MS  Excel  para  el  mismo  conjunto  de  datos  (en  este  caso  los 
cuartiles  se  han  obtenido  usando  las  fórmulas  integradas  de  Excel). 
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Figura  1 3.  Pasos  para  calcular  estadísticos  descriptivos  con  Mlnltab 


Pasos  a seguir 


i I C16 

Calificaciones 

1 

MÍ 

2 

4,7 

3 

8,2 

4 

9,5 

5 

8.8 

6 

7,2 

7 

6,7 

8 

6,6 

9 

6,8 

10 

9,8 

11 

9,0 

3 


Stat  Graph  Editor  Tools  Window  Help 


[ Basic  Statistics 

Q 

*s!l 

Display  Descriptive  Statistics. 

Regression  ► 

. ANOVA  ► 

Store  Descriptive  Statistics... 

á i Graphical  Summary . . . 

4 

i 


2 


>• 


Display  Descriptive  Statistics 


d 


C2  Hotspots 
C5  Frecuencia 
C8  Normal 
C9  Calidad 
CIO  Calificaciones 
Cll  Datos 
C13  Unifl 
C14  Weibull 
C16  Calificaciones 


Variables: 


Calificaciones 

^1 

d 

By  variables  (optional): 

d 

d 

Select 


Help 


Statistics... 

Graphs... 

OK 

Cancel 

Una  vez  Introducidos  los  datos 
en  el  programa  (1),  se  sigue  la 
ruta  Stat  > Basic  Statistics  > Dis- 
play Descriptive  Statistics.  ..(2)  y 
se  seleccionan  las  variables  en  la 
ventana  correspondiente  (3). 


Figura  14.  Estadísticos  descriptivos  obtenidos  con  Minitab 


dQJd 


Descriptive  Statistics:  Calificaciones 


Variable  N N*  Mean  SE  Mean  StDev  Mínimum  Q1  Median  Q3 

Calificaciones  50  0 7.416  0.239  1.691  0.100  6.675  7.550  8.650 


Variable  Máximum 

Calificaciones  9.800 


J 

d 

2O 


Figura  15.  Estadísticos  descriptivos  calculados  con  Excel 


A | B 

C 

D 

1 

i 

Calificaciones 

2 

6,0 

Calificaciones 

3 

4,7 

4 

8,2 

Media 

7,416 

5 

9,5 

Error  típico 

0,239205488 

6 

8,8 

Mediana 

7,55 

7 

7,2 

Moda 

7.2 

8 

6,7 

Desviación  estándar 

1,691438224 

9 

6,6 

Varianza  de  la  muestra 

2,860963265 

10 

6,8 

Curtosis 

5,922785035 

11 

9,8 

Coeficiente  de  asimetría 

-1 ,720324942 

12 

9,0 

Rango 

9,7 

13 

7,7 

Mínimo 

0.1 

14 

8,6 

Máximo 

9,8 

15 

5,8 

Suma 

370,8 

16 

6,4 

Cuenta 

50 

17 

9,5 

18 

7,4 

Cuartil  primero 

6,725 

19 

7,2 

Cuartil  segundo 

7,55 

20 

8,8 

Cuartil  tercero 

8,6 

21 

7,4 

Diferencias  en  los 
métodos  de  cálculos 

Cabe  destacar  que  hay  ligeras 
diferencias  entre  los  valores  de 
los  cuartiles  calculados  por 
Minitab  y los  correspondientes 
valores  de  Excel.  Ello  se  debe 
a que  usan  métodos  de  cálculo 
distintos.  Una  discusión  intere- 
sante sobre  los  diferentes  mé- 
todos existentes  para  calcular 
los  cuartiles  se  puede  encon- 
trar en:  http://mathforum.org/ 
library/drmath/view/ 
60969.html. 
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Diagrama  de  cajas  y bigotes  ( boxplot ) 

Usando  los  cuartiles  es  posible  construir  un  tipo  de  gráfico,  el  diagrama  de  ca- 
jas y bigotes  (boxplot),  que  resulta  muy  útil  para  visualizar  la  distribución  de 
los  datos.  Este  diagrama  está  compuesto  por  una  caja  central,  definida  por  los 
cuartiles  primero  y tercero,  que  contiene  el  50%  "central"  de  las  observacio- 
nes, y dos  segmentos  situados  en  los  respectivos  extremos  de  la  caja,  represen- 
tando cada  uno  de  ellos  el  25%  de  las  observaciones  extremas  (figura  16). 

Figura  16.  Diagrama  de  cajas  y bigotes  ( boxplot ) y valores  extremos  ( outliers ) 


Boxplot  para  la  variable  "calificaciones" 


El  diagrama  de  cajas  y bigotes  sirve  también  para  identificar  posibles  valo- 
res anómalos  (outliers),  que  se  encuentran  excesivamente  alejados  del  resto 
de  los  datos,  es  decir:  o bien  son  extremadamente  grandes  o bien  extrema- 
damente pequeños  en  comparación  con  el  resto  de  observaciones.  Estos  va- 
lores anómalos  se  suelen  representar  mediante  un  asterisco,  y pueden  ser 
debidos  a un  error  en  el  registro  de  los  datos  o bien  a valores  que,  en  reali- 
dad, se  encuentran  extremadamente  alejados  del  resto  de  observaciones  (p.  ej.: 
el  precio  de  un  Ferrari  cuando  se  compara  con  precios  de  turismos  de  gama 
media).  Identificar  valores  anómalos  en  un  conjunto  de  observaciones  es 
importante,  puesto  que  el  análisis  de  los  datos  puede  dar  resultados  muy 
distintos  en  función  de  que  se  consideren  o no  dichos  valores  en  el  estudio 
(por  ejemplo,  la  media  y la  varianza  de  un  conjunto  de  datos  pueden  cam- 
biar de  forma  notable  según  se  incluya  o no  uno  de  estos  valores  extremos). 

La  estrecha  relación  existente  entre  el  histograma  y el  boxplot  se  puede  ob- 
servar en  la  figura  17.  En  cierto  sentido,  el  boxplot  se  puede  interpretar 
como  un  histograma  visto  desde  arriba.  En  este  caso,  la  zona  del  boxplot  si- 
tuada entre  los  cuartiles  primero  y tercero  correspondería  a la  zona  central 
del  histograma.  Además,  en  ambos  casos  queda  identificado  el  valor  anó- 
malo (outlier)  así  como  la  forma  aproximadamente  simétrica  del  resto  de  la 
distribución. 
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4.  El  concepto  de  probabilidad 


Un  experimento  aleatorio  es  aquel  en  el  que  no  es  posible  conocer  a priori  el 
suceso  resultante  que  acontecerá  pero,  sin  embargo,  sí  es  posible  observar  un 
cierto  patrón  regular  en  los  resultados  que  van  sucediendo  cuando  el  experi- 
mento se  repite  muchas  veces.  Por  ejemplo,  cuando  se  considera  el  experimento 
aleatorio  consistente  en  lanzar  una  moneda  (o  un  dado)  al  aire,  no  es  posible 
predecir  cuál  será  el  suceso  resultante  del  experimento,  es  decir,  si  saldrá  cara  o 
cruz  (o  qué  número  saldrá  en  el  caso  del  dado);  sin  embargo,  sí  se  puede  afirmar 
que  tras  muchos  lanzamientos  el  porcentaje  o proporción  de  sucesos  "cara"  ob- 
tenidos será  muy  próximo  al  50%  o 1/2  (en  el  caso  del  dado,  el  porcentaje  o pro- 
porción de  sucesos  "3"  obtenidos  será  muy  próximo  a 0,1667  o 1/6).  Este 
porcentaje  o proporción  de  aparición  de  un  suceso  tras  muchas  repeticiones  del 
experimento  es  lo  que  da  lugar  a la  idea  de  probabilidad: 


Ejemplo 

La  probabilidad  de  un  suceso 
es  siempre  un  número  entre  0 
y 1 . Así,  por  ejemplo,  una  pro- 
babilidad de  0,25  representa 
un  porcentaje  de  aparición  del 
25%  o,  equivalentemente,  una 
proporción  de  1 /4. 

Se  define  la  probabilidad  de  un  suceso  A,  P{A),  como  el  porcentaje  o pro- 
porción de  aparición  de  dicho  suceso  en  una  serie  extraordinariamente  lar- 
ga de  repeticiones  del  experimento,  todas  ellas  independientes  entre  sí. 


El  requisito  de  independencia  entre  las  distintas  repeticiones  del  experimento 
aleatorio  significa  que  el  resultado  de  cada  repetición  del  experimento  no  está 
condicionado  por  los  resultados  obtenidos  en  repeticiones  anteriores  (p.  ej.: 
cuando  se  lanza  varias  veces  una  moneda  al  aire,  el  suceso  resultante  de  cada 
nuevo  lanzamiento  es  independiente  de  los  resultados  obtenidos  en  lanza- 
mientos previos). 

Ejemplo  1 de  probabilidades 

En  el  experimento  "lanzamiento  de  una  moneda  al  aire",  es  posible  considerar 
los  siguientes  sucesos  o potenciales  resultados:  C = ¡cara),  X = (cruz),  Q = ¡cara 
o cruz)  y 0 = {ni  cara  ni  cruz).  Los  dos  últimos  sucesos  se  conocen,  respectiva- 
mente, como  suceso  seguro  Q (que  incluye  todos  los  resultados  posibles)  y su- 
ceso imposible  o conjunto  vacío  0 (que  no  incluye  ningún  resultado  derivado 
de  la  ejecución  del  experimento).  En  este  caso,  parece  claro  que  P(C)  = 0,5  (es 
decir,  si  se  repitiera  el  experimento  muchas  veces,  aproximadamente  el  50% 
de  las  mismas  serían  caras),  P(X)  = 0,5,  P( Q)  = 1 (es  decir,  en  el  100%  de  los 
lanzamientos  saldrá  o bien  cara  o bien  cruz)  y P(0)  = 0 (es  decir,  en  el  0%  de 
los  lanzamientos  no  se  obtendrá  resultado  alguno). 

Ejemplo  2 de  probabilidades 

En  el  experimento  aleatorio  "lanzamiento  de  un  dado",  es  posible  considerar 
sucesos  o potenciales  resultados  como  los  siguientes:  { 1},  {2¡,  {3¡,  (4),  {5¡,  ¡6¡, 
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Q = {un  número  entre  1 y 6j,  0 = {ningún  número  entre  1 y 6¡.  En  este  caso, 
P({1¡)  = 1/6  (tras  muchas  repeticiones,  uno  de  cada  seis  lanzamientos  acabará 
siendo  un  1),  P({ 2})  = 1/6,  P({3¡)  = 1/6,  P({4{)  = 1/6,  P({5¡)  = 1/6,  P({6})  = 1/6, 
P(Q)  = 1 y P(0)  = 0. 

Observar,  además,  que  también  es  posible  considerar  sucesos  compuestos  co- 
mo, por  ejemplo,  par  = {2,  4,  6},  impar  = ¡1,  3,  5},  mayor2  = {3,  4,  5,  6¡,  menor3 
= {1,  2¡,  etc.  En  este  caso,  P(par)  = 3/6  = 1/2,  P(impar)  = 1/2,  P(mayor2)  = 4/6 
= 2/3,  P(menor3)  = 2/6  = 1/3. 

Propiedades  básicas  de  las  probabilidades 

Hay  una  serie  de  propiedades  básicas  que  debe  satisfacer  cualquier  proba- 
bilidad. Estas  propiedades  son  muy  útiles  a la  hora  de  calcular  probabilida- 
des de  sucesos  complejos  a partir  de  probabilidades  ya  conocidas  o fáciles 
de  obtener: 

1)  La  probabilidad  de  cualquier  suceso  A siempre  es  un  número  situado  entre 
0 y 1 (ambos  inclusive),  es  decir  0 < P(A ) < 1 . 

Ejemplo:  en  los  ejemplos  anteriores,  todas  las  probabilidades  halladas  eran  va- 
lores entre  0 y 1. 

2)  La  probabilidad  del  suceso  imposible  o conjunto  vacío  0 es  siempre  0,  es 
decir,  P(0)  = 0.  En  otras  palabras,  cuando  se  hace  un  experimento  aleatorio 
siempre  se  obtiene  algún  resultado  y,  por  tanto,  la  proporción  de  "no-resulta- 
dos" es  0. 

Ejemplo:  en  los  ejemplos  anteriores,  P(0)  = 0. 

3)  La  suma  de  las  probabilidades  de  todos  los  posibles  resultados  del  experi- 
mento aleatorio  siempre  vale  1.  En  otras  palabras,  la  probabilidad  del  suceso 
seguro  es  siempre  1. 

Ejemplo:  En  el  ejemplo  de  la  moneda,  P{ Q)  = 1 = P(C)  + P(X);  en  el  ejemplo 
del  dado,  P(O)  = 1 = P({lj)  + P({2¡)  + P({3})  + P({4¡)  + P({5|)  + P({6¡). 

4)  La  probabilidad  de  que  un  suceso  no  ocurra  es  1 menos  la  probabilidad  de 
que  sí  ocurra,  es  decir:  P(no  A)  = 1 - P(A). 

Ejemplo:  en  el  ejemplo  de  la  moneda,  P(C)  = 0,5  = 1 - P(no  C ) = 1 - P{X);  en 
el  ejemplo  del  dado,  P(par)  = 0,5  = 1 - P(no  par)  = 1 - P(impar);  P(0)  = 1 - P(Q). 


5)  Si  dos  sucesos  A y B no  tienen  resultados  comunes  (son  disjuntos),  la  pro- 
babilidad de  que  ocurra  A u B es  la  suma  de  las  probabilidades,  es  decir,  si  A y 
B son  disjuntos,  P(A  uB)=  P(A)  + P(B). 
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Ejemplo:  en  el  ejemplo  de  la  moneda,  P(C  u X)  = P(C ) + P(X)  = 1;  en  el  ejemplo 
del  dado,  P((l,  2))  = P({1})  + P({2|)  = 2/6  = 1/3;  P( Q u 0)  = P(Q)  + P(0)  = 1 + 0=1. 

6)  En  general,  para  cualesquiera  dos  sucesos  Ay  B se  cumplirá  que  P{A  u B)  = 
P(A ) + P(B)  - P(A  n B),  donde  “A  n B"  es  el  conjunto  de  posibles  resultados  que 
satisfacen  los  sucesos  A y B a la  vez.  Hay  que  tener  en  cuenta  que  cuando  A y 
B son  disjuntos  (no  tienen  resultados  en  común),  “A  n B"  = 0 y,  por  tanto, 
P{A  u B)=  P{A)  + P{B ) - P(0)  = P{A)  + P(B ) - 0 = P(A ) + P(P),  que  es  la  expre- 
sión vista  en  la  propiedad  anterior. 

Ejemplo:  en  el  ejemplo  del  dado,  P( par  umayor2)  =P(par)  +P(mayor2)  -P(par 
n mayor2)  = 3/6  + 4/6  - 2/6  = 5/6  (observar  que  "par  n mayor2"  = {4,  6)). 
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5.  Distribuciones  de  probabilidad  discretas 


Al  inicio  de  este  módulo  se  definió  el  concepto  de  variable  cuantitativa  discre- 
ta como  aquella  variable  cuantitativa  que  podía  tomar  un  número  finito  o 
contable  de  valores  distintos.  Así,  un  ejemplo  de  variable  discreta  sería  X = "re- 
sultado del  lanzamiento  de  un  dado",  ya  que  dicha  variable  sólo  puede  tomar 
seis  posibles  valores. 


Cada  uno  de  los  posibles  valores  de  una  variable  discreta  tendrá  asociada  una 
probabilidad  de  ocurrencia  (p.  ej.,  en  el  caso  del  dado,  la  probabilidad  de  ob- 
tener un  2 será  de  1/6),  por  lo  que  parece  natural  estudiar  cómo  se  distribu- 
yen o comportan  dichas  probabilidades.  En  concreto,  se  puede  definir  una 
"función  de  probabilidad”,  f(x),  que  asocie  a cada  valor  x de  la  variable  dis- 
creta X su  probabilidad  de  ocurrencia,  P(x).  Por  ejemplo,  en  el  caso  de  la  va- 
riable anterior,  asociada  al  experimento  aleatorio  "lanzamiento  de  un  dado 
normal",  la  correspondiente  función  de  probabilidad  sería:  /TI)  = P(X  = 1)  = 
1/6,  f( 2)  = P(X  = 2)  = 1/6,  f( 3)  = P(X  = 3)  = 1/6,  f( 4)  = P(X  = 4)  = 1/6,  f(S)  = P(X 
= 5)  = 1/6,  f(6)  = P(X  = 6)  = 1/6. 


Observad 

Fijaos  que  si  se  usara  un  dado 
"trucado",  no  todas  las  proba- 
bilidades de  ocurrencia  serían 
iguales  y,  por  tanto,  la  función 
de  probabilidad  tomaría  valo- 
res distintos  para  distintos  va- 
lores posibles  de  la  variable. 

Dada  una  variable  aleatoria  discreta  X,  resulta  útil  conocer  la  distribu- 
ción de  probabilidad  de  dicha  variable,  es  decir,  cómo  se  distribuyen 
o comportan  las  probabilidades  de  ocurrencia  de  sus  posibles  valores.  A 
tal  efecto  se  definen  las  siguientes  funciones: 

La  función  de  probabilidad  de  X es  aquella  función  f(x)  que  asigna  a 
cada  posible  valor  x de  X su  probabilidad  de  ocurrencia,  es  decir:  f(x)  = 
P(X  = x)  para  todo  valor  posible  x de  X. 

La  función  de  distribución  de  X es  aquella  función  F(x)  que  asigna  a 
cada  posible  valor  x de  X su  probabilidad  acumulada  de  ocurrencia,  es 
decir  F(x)  = P(  X < x)  para  todo  valor  posible  x de  X. 


La  tabla  3 muestra  la  función  de  probabilidad  y la  función  de  distribución  corres- 
pondientes a la  variable  X anterior  pero  usando  un  dado  "trucado"  que  tiene  dos 
valores  6 y ningún  valor  2.  Por  su  parte,  la  figura  18  muestra  ambas  funciones  su- 
perpuestas en  el  mismo  gráfico.  Observando  detenidamente  la  tabla  3 y la  figura 
18  se  pueden  deducir  las  siguientes  características  propias  de  estas  funciones: 

• Puesto  que  representan  probabilidades,  ambas  funciones  siempre  toman 
valores  en  el  intervalo  [0,  1]. 

• La  suma  de  todos  los  valores  que  toma  la  función  de  probabilidad  siempre 
ha  de  ser  1 (ello  se  debe  a las  propiedades  de  la  probabilidad). 
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La  función  de  distribución  siempre  es  una  función  creciente  que  pasa  de  valor 
0 en  su  extremo  izquierdo  (F( 0)  = P(X  < 0)  = 0)  a valor  1 en  su  extremo  derecho 
(F(6)  = P(X  < 6)  = 1). 


Tabla  3.  Fundones  de  probabilidad  y distribución  para  una  variable  discreta 


Variable  X 

Función  de  probabilidad 
f(x)  = P(X  = x) 

Función  de  distribución 

F(x)  = P(X  < x) 

1 

1/6 

1/6 

2 

0 

1/6 

3 

1/6 

2/6 

4 

1/6 

3/6 

5 

1/6 

4/6 

6 

2/6 

1 

Total 

1 

Figura  1 8.  Funciones  de  probabilidad  y distribución  de  una  variable  discreta 

Funciones  de  probabilidad  y distribución 


X 


Parámetros  descriptivos  de  una  distribución  discreta 

Mientras  que  los  estadísticos  descriptivos  y los  gráficos  o tablas  de  frecuen- 
cias se  utilizan  para  analizar  el  comportamiento  (distribución)  de  una 
muestra  de  observaciones  empíricas,  las  distribuciones  de  probabilidad  son 
modelos  estadísticos  que  usan  parámetros  y funciones  de  distribución  para 
describir  el  comportamiento  teórico  (distribución  teórica)  de  toda  una  po- 
blación. De  forma  análoga  a lo  que  ocurría  con  las  muestras  -que  se  carac- 
terizan por  estadísticos  descriptivos  como  la  media  o la  varianza  muestral-, 
las  distribuciones  de  probabilidad  asociadas  a poblaciones  también  suelen 
caracterizarse  por  parámetros  tales  como  la  media  o la  varianza  poblacio- 
nal.  Ahora  bien,  puesto  que  en  general  no  se  dispondrá  de  observaciones 
sobre  toda  la  población  sino  sólo  de  una  función  de  distribución  o de  pro- 
babilidades, la  forma  de  calcular  dichos  parámetros  es  algo  distinta: 


Estadística  descriptiva  univariante 
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• Media  o valor  esperado  de  una  variable  discreta:  la  media  o valor  espe- 
rado de  una  variable  discreta  X que  puede  tomar  los  valores  *2,  • se 
representa  con  p o E[X\  y se  calcula  de  la  siguiente  forma: 

y.  = E[X]  = x1P(X  = x1)  + X2-P(X  = x2)  + ...  = YJXt-f(x¡ ) 

donde  f(x)  denota  a la  función  de  probabilidad  de  X. 

Ejemplo:  el  caso  de  un  dado  equilibrado,  el  valor  esperado  o media  de 
X = "resultado  del  lanzamiento"  sería  p = 3;  sin  embargo,  en  el  caso  del 
dado  "trucado"  que  se  muestra  en  la  tabla  3,  la  media  o valor  esperado  es: 

P = 1 • f(l)  + 2 • ^(2)  + 3 • f(3)  + 4 • f(4)  + 5 • ^(5)  + 6 • f(6)  = 

= 1— + 2-0  + 3— + 4-  — + 5— + 6— = 4,167 
6 6 6 6 6 

• Varianza  y desviación  estándar  de  una  variable  discreta:  la  varianza  de 
una  variable  discreta  X que  puede  tomar  los  valores  X\,  x2,  . . .,  se  representa 
con  a2  y se  calcula  de  la  siguiente  forma: 

o2  =(*i-f02  ■P{x  = x1)  + (x2  -p)2  ■P(X  = x2)  + ...  = Yj(x¡-[í)z  -f(x¡) 

i 

donde  f(x)  denota  a la  función  de  probabilidad  de  X.  De  forma  análoga  a 
cómo  ocurría  con  los  estadísticos  muéstrales,  la  desviación  estándar  de  una 
variable  es  la  raíz  cuadrada  positiva  de  su  varianza,  es  decir: 


Ejemplo:  en  el  caso  del  dado  "trucado"  que  se  muestra  en  la  tabla  3,  la  va- 
rianza es: 


o2  =(1-4,167)2  - - + (2-4,167)2-0  + (3-4,167)2  •-  + 

6 6 

+ (4-4,167)2  - i + (5-4,167)2-i  + (6-4,167)2-|  = 3,139 

Y la  correspondiente  desviación  estándar:  o = ^3,139  =1,772 

La  distribución  binomial 

Una  de  las  distribuciones  discretas  más  usadas  en  la  práctica  es  la  distribución  bi- 
nomial. Esta  distribución  se  usa  para  contestar  a preguntas  como  las  siguientes: 

• Si  cada  vez  que  un  sistema  informático  es  atacado  por  un  virus  la  probabi- 
lidad de  que  el  sistema  no  falle  es  de  0,76,  ¿cuál  es  la  probabilidad  de  que 
no  se  haya  producido  ningún  fallo  en  el  sistema  tras  cinco  ataques? 
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• Si  cada  vez  que  se  consulta  una  fuente  de  información  la  probabilidad  de  que 
ésta  proporcione  una  respuesta  satisfactoria  es  de  0,85,  ¿cuál  es  la  probabili- 
dad de  que  se  obtenga  alguna  respuesta  satisfactoria  tras  tres  consultas? 

• Si  tras  la  administración  de  un  fármaco  a un  paciente  en  estado  crítico  la  pro- 
babilidad de  supervivencia  de  éste  es  de  0,99,  ¿cuál  es  la  probabilidad  de  que 
sobrevivan  los  catorce  pacientes  críticos  que  han  recibido  el  tratamiento? 

• Si  la  probabilidad  de  obtener  una  concesión  para  un  proyecto  de  investiga- 
ción es  de  0,20,  ¿cuál  es  la  probabilidad  de  obtener  al  menos  una  concesión 
tras  tres  intentos? 

• Si  cada  vez  que  se  trata  de  encuestar  a un  transeúnte  elegido  al  azar  la  pro- 
babilidad de  que  responda  es  de  0,15,  ¿cuál  es  la  probabilidad  de  que  se 
consigan  obtener  ochenta  respuestas  o más  a partir  de  una  muestra  aleato- 
ria de  ciento  cincuenta  transeúntes? 


La  distribución  binomial  es  un  modelo  estadístico  que  permite  calcu- 
lar probabilidades  sobre  la  variable  aleatoria  X = "número  de  éxitos  con- 
seguidos en  n pruebas  independientes".  Cada  una  de  estas  n pruebas  es 
una  repetición  de  un  experimento  aleatorio  cuyo  resultado  es  binario 
(éxito  o fracaso),  siendo  p la  probabilidad  de  "éxito"  en  cada  prueba  y 
q = 1 - p la  probabilidad  de  "fracaso". 


Cabe  observar  que  la  variable  X = "número  de  éxitos  en  n pruebas  indepen- 
dientes" puede  tomar  cualquier  valor  k entre  0 y n (ambos  inclusive).  Se  suele 
usar  la  notación  X ~ B (n,  p)  para  indicar  que  X se  distribuye  o se  comporta 
según  una  distribución  binomial  de  parámetros  n (número  de  pruebas  o repe- 
ticiones) y p (probabilidad  de  "éxito”  en  cada  prueba).  En  tales  condiciones, 
las  probabilidades  asociadas  a dicha  variable  vienen  dadas  por  la  expresión 
matemática  siguiente: 


Para  cualquier  k entre  0 y n,  P ( X = k)  = pk  • (1  - p)"  k , donde 


ni 


k)  k\(n-k)l 


siendo  0!  = 1!  = 1 y n\  = n ■ (n  - 1) ...  1 para  todo  n > 1 . 


Se  cumple,  además,  que  la  media  (valor  esperado)  y la  varianza  de  una  distri- 
bución binomial  son,  respectivamente:  \i  = n ■ p y <j2  = //■/;■  (1  - p). 


Ejemplo:  la  probabilidad  de  que  al  introducir  datos  en  un  formulario  web  se 
cometa  un  error  es  de  0,1.  Si  diez  personas  rellenan  el  formulario  de  forma 
independiente,  ¿cuál  es  la  probabilidad  de  que  no  haya  más  de  un  formula- 
rio erróneo?,  ¿cuál  es  el  valor  esperado  y la  desviación  estándar  de  la  variable 
considerada? 


Distribución  de  Poisson 
y la  uniforme  discreta 


Otras  distribuciones  discretas 
muy  habituales  son  la  distribu- 
ción de  Poisson  y la  uniforme 
discreta.  Es  posible  encontrar 
en  Internet  abundante  docu- 
mentación sobre  éstas  y otras 
distribuciones  discretas  así 
como  sobre  sus  ámbitos  de 
aplicación. 


Resultado  "éxito" 


No  debe  confundirse  el  resulta- 
do "éxito"  de  un  experimento 
aleatorio  con  el  hecho  de  que 
el  resultado  sea  deseable  desde 
un  punto  de  vista  social  o sub- 
jetivo. Así,  por  ejemplo,  se  po- 
dría considerar  "éxito"  del 
experimento  aleatorio  el  fallo 
del  sistema  informático  que  su- 
fre el  ataque  de  un  virus. 


Observad 


La  expresión  "n\"  se  lee  como 
"factorial  de  n"  o "n  factorial". 
Así,  por  ejemplo,  4!  = 4 • 3 • 2 ■ 1 
y 6!  = 6 • 5 ■ 4 ■ 3 ■ 2 • 1 . Sin  em- 
bargo, 1 ! = 1 y 0!  = 1 . 
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Fijémonos  en  que,  en  este  caso,  X = "número  de  formularios  erróneos  en  diez 
pruebas"  y X~B  (10,  0,1).  Además,  se  pide  P(X<1)  = P(X  = 0 uX  = 1)  = P(X  = 0) 
+ P(X  = 1)  (puesto  que  son  sucesos  disjuntos).  Ahora  bien: 


P(X  = 0)  = (¿°]0,1°  • (0,9)10  = _^1-(1)(0,3487)  = 0,3487 

P(X  = 1)  = ^°Jo,l‘ ' (O,9)9  = I^T(0'1)(0'3874)  = 0,3874 

Por  tanto,  P{X  < 1)  = 0,3874  + 0,3487  = 0,7361.  Finalmente,  p = 10  • 0,1  = 1 y 
o = VIO  0,1  0,9  = 0,9487. 

En  la  práctica,  los  cálculos  probabilísticos  anteriores  se  suelen  automatizar  con 
la  ayuda  de  algún  programa  estadístico  o de  análisis  de  datos.  La  figura  19 
muestra  cómo  se  pueden  calcular  probabilidades  de  una  binomial  con  ayuda 
de  Minitab.  La  figura  20,  por  su  parte,  muestra  cómo  obtenerlas  usando  Excel. 


Pasos  a seguir 


Se  sigue  la  ruta  Calo  Probabi- 
llty  Distributions  > Binomial  (1) 
y se  completan  los  parámetros 
en  la  ventana  correspondiente 

(2) .  El  resultado  se  muestra  en 

(3) .  Observar  que,  si  en  lugar 
de  escoger  la  opción  Cumulati- 
ve probability  en  (2)  se  hubiera 
escogido  la  opción  Probability, 
el  programa  hubiera  calculado 
P(X  = 1 ) en  lugar  de  P(X  <=  1 ). 
Finalmente,  para  una  probabi- 
lidad p dada,  la  opción  Inverse 
cumulative  probability  devuelve 
aquel  valor  cde  la  variable  X tal 
que  P(X  <=  c)  = p. 


Figura  1 9.  Cálculo  de  probabilidades  en  una  binomial  con  Minitab  y Excel 
Cale  Stat  Graph  Editor  lools 
\Wj  Cajculator... 

II  Column  Statistlcs. . . 

Row  Statistics. . . 

*:1  Standardize... 


Make  Patterned  Data 
Make  Mesh  Data... 

»¿»  Make  Indicator  Variables. 

Set  Base... 

Random  Data 


Probability  Distributions 


Geometrlc... 
Negatlve  Binoi1 
Hypergeometr 
Discrete... 
Integer... 
Polsson... 


Binomial  Distribution 


Cumulative  Distribution  Function 

Binomial  with  n = 10  and  p = 0,1 

x P(  X <=  x ) 

1 0,736099 


Select 


C Probability 

Cumulative  probability 
C Inverse  cumulative  probability 


Number  of  triáis: 
Event  probability: 

C Input  co[umn: 

Optional  storage: 
f*  Input  constant: 
Optional  storage: 


10 


0,1 


IaJ  J 


J 

A 


X I 


Help 

OK 

Cancel 

C1  ~ f*  =DISTR.BIN0M(1,1 0,0.1, VERDADERO) 


A 

B 

C 1 D 

E 

1 

P(X  <=  1) 

1 0,736098931 

2 

P(X=  1) 

0,38742049’ 

3 

P(X=0) 

0,34867844 
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La  figura  20  se  muestra  la  función  de  probabilidad  asociada  a la  binomial  del 
ejemplo  anterior.  Se  observa  que,  aunque  en  teoría  los  posibles  valores  de  la 
variable  X irían  desde  0 hasta  10  (número  de  pruebas),  en  la  práctica  los  valo- 
res mayores  de  4 tienen  probabilidad  de  suceso  prácticamente  nula  (por  ejem- 
plo, es  muy  poco  frecuente  que  se  obtengan  valores  superiores  a 4).  En  efecto, 
P(X  > 4)  = 1 - P(X  <=  4)  = ¡usando  Minitab  o Excel)  = 1 - 0,9984  = 0,0016. 

Figura  20.  Función  de  probabilidad  de  una  6 (1 0,  0,1 ) 


Función  de  probabilidad 


X 


Las  probabilidades  anteriores  se  pueden  obtener  también  mediante  el  uso  de 
tablas  estadísticas  (sin  necesidad  de  usar  ningún  software).  Así,  siguiendo  el 
ejemplo  anterior,  la  figura  21  muestra  cómo  calcular  P(X  = 1)  usando  la  tabla 
binomial.  En  este  caso,  X es  una  B(10,  0,1)  y se  quiere  hallar  P(X  = k ) siendo 
k = 1.  Para  ello,  se  busca  la  sección  de  la  tabla  correspondiente  a n = 10,  y la 
intersección  entre  la  fila  k = 1 y la  columna  p = 0,1. 


Cálculo  de  probabilidades 


Resulta  fácil  encontrar  en  In- 
ternet abundantes  documen- 
tos que  explican  con  todo 
detalle  el  uso  de  tablas  para 
calcular  probabilidades.  En  la 
medida  de  lo  posible,  sin  em- 
bargo, conviene  automatizar 
los  cálculos  mediante  el  uso 
de  software. 
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Figura  21.  Cálculo  de  probabilidades  blnomiales  mediante  tablas 
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6.  Distribuciones  de  probabilidad  continuas 


Al  inicio  de  este  módulo  se  definió  el  concepto  de  variable  cuantitativa  conti- 
nua como  aquella  variable  cuantitativa  que  podía  tomar  un  número  infinito 
(no  contable)  de  valores  distintos.  Así,  un  ejemplo  de  variable  continua  sería 
X = "tiempo  que  se  tarda  en  desarrollar  un  portal  web",  ya  que  esta  variable 
puede  tomar  un  valor  real  cualquiera  entre  0 e infinito. 

A diferencia  de  lo  que  ocurría  con  las  variables  discretas,  cuando  se  trabaja  con 
variables  continuas  no  es  posible  definir  una  función  de  probabilidad  que 
asigne  probabilidades  a los  distintos  valores  de  la  variable:  si  X es  una  variable 
continua,  X puede  tomar  un  número  infinito  (no  contable)  de  valores,  por  lo 
que  la  probabilidad  teórica  de  que  la  variable  X tome  un  valor  concreto  a:  es 
siempre  0,  es  decir:  P(X  = x)  = 0 para  cualquier  valor  a de  X.  Sí  es  posible,  sin 
embargo,  asignar  probabilidades  a intervalos  de  valores.  Por  ejemplo,  si  el  51% 
de  los  portales  web  tardan  en  desarrollarse  entre  240  y 258  horas,  entonces 
P(240  < X < 258)  = 0,51.  Para  describir  la  distribución  de  probabilidad  de  una 
variable  continua  se  sigue  usando  la  función  de  distribución  (aunque  con  al- 
gún matiz  nuevo)  y,  además,  se  usa  también  la  llamada  "función  de  densidad" 
en  lugar  de  la  función  de  probabilidad  típica  de  variables  discretas: 


La  función  de  densidad  de  una  variable  continua  X es  una  función  f( a) 
tal  que  la  probabilidad  de  que  X tome  un  valor  en  un  intervalo  (a,  b ) coin- 
cide con  el  área  "encerrada”  por  dicha  función  entre  los  extremos  de  dicho 
intervalo  (figura  22),  es  decir:  P(a  < X < b)  = área  bajo  f{ x)  entre  ay  b. 

La  función  de  distribución  de  X es  aquella  función  F( a)  que  asigna  a 
cada  posible  valor  a de  A su  probabilidad  acumulada  de  ocurrencia  (fi- 
gura 23),  es  decir,  F( a)  = P{  X < x ) = área  bajo  f(x)  desde  -oo  (menos  infi- 
nito) hasta  a. 

La  figura  22  muestra  la  función  de  densidad  de  una  variable  con  distribución 
simétrica  y centrada  en  el  valor  250  (puesto  que  la  función  es  totalmente  si- 
métrica la  media  y la  mediana  coinciden  en  este  punto).  Se  observa  también 
el  área  encerrada  bajo  función  de  densidad  entre  los  valores  a = 240  y b = 258. 
Esta  área  corresponde  con  la  probabilidad  siguiente:  P(240  < X < 258).  Por  su 
parte,  la  figura  23  muestra  la  función  de  distribución  asociada  a la  misma  va- 
riable. Nuevamente  se  aprecia  la  simetría  con  respecto  al  valor  central,  así 
como  el  hecho  de  que  la  función  de  distribución  va  creciendo  conforme  va 
acumulando  probabilidades,  pasando  del  valor  0 en  su  extremo  izquierdo  al 
valor  1 en  su  extremo  derecho.  A partir  de  esta  gráfica  se  pueden  estimar  vi- 
sualmente probabilidades  acumuladas,  por  ejemplo:  P(X  <=  260)  será  un  valor 
muy  cercano  a 0,8. 


Nota 


En  variables  continuas,  puesto 
que  P(X  = x)  = 0 para  cualquier 
valor  x de  X,  se  cumplirá  que: 

a)  P(X  < x)  = P(X  < x) 

b)  P{X  > x)  = P(X  > x) 


Nota 


La  función  de  densidad  f(x) 
siempre  es  positiva  y "encie- 
rra" un  área  total  de  1 . 


Atención 


Observar  la  equivalencia  entre 
los  conceptos  de  "probabili- 
dad" y "área". 
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Figura  22.  Función  de  densidad  de  una  variable  continua  y área  encerrada 


Función  de  densidad  f(x)  y área  encerrada  entre  240  y 258 


Figura  23.  Función  de  distribución  de  una  variable  continua 

Función  de  distribución  F(x) 


Parámetros  descriptivos  de  una  distribución  continua 

En  el  caso  de  distribuciones  continuas,  la  forma  de  calcular  los  parámetros  es 
similar  a la  empleada  para  distribuciones  discretas,  si  bien  ahora  los  sumato- 
rios  se  sustituyen  por  áreas  (integrales  definidas  en  términos  matemáticos)  en- 
tre dos  extremos: 

• Media  o valor  esperado  de  una  variable  continua:  la  media  o valor  espe- 
rado de  una  variable  continua  X se  representa  por  p o E[X\  y se  calcula  de 
la  siguiente  forma: 

p = E[X\  = área  total  bajo  “x  ■ f(x)"  = J x ■ f(x)dx 
donde  f(x)  denota  a la  función  de  densidad  de  X. 


Función  de  distribución 


La  función  de  distribución  es 
una  fundón  acumulativa  de 
probabilidades  y,  por  tanto,  es 
siempre  creciente,  pasando  de 
0 (extremo  izquierdo)  a 1 (ex- 
tremo derecho). 


Atención 


Aunque  en  la  práctica  se  hará 
uso  de  programas  estadísticos 
para  hacer  los  cálculos,  es  im- 
portante conocer  qué  concep- 
tos se  usan  para  definir  cada 
tipo  de  parámetro. 
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• Varianza  y desviación  estándar  de  una  variable  continua:  la  varianza 
de  una  variable  continua  X se  representa  por  o2  y se  calcula  de  la  si- 
guiente forma: 

a2  = área  total  bajo  “(x  - p)2  • f(x)"  = J+  (x-p)2  f(x)dx 

donde  f(x)  denota  a la  función  de  densidad  de  X.  Como  siempre,  la  des- 
viación estándar  de  una  variable  es  la  raíz  cuadrada  positiva  de  su  va- 
rianza, es  decir: 


La  distribución  normal  o gaussiana 

La  distribución  normal  o gaussiana  es  la  distribución  teórica  más  importante. 
Muchas  variables  continuas  siguen  una  distribución  normal  o aproximada- 
mente normal.  Otras  variables  continuas  y discretas  también  pueden,  en  de- 
terminadas circunstancias,  ser  aproximadas  mediante  una  distribución 
normal.  La  normal,  además,  es  una  distribución  clave  en  la  estadística  inferen- 
cial  ya  que  algunas  de  sus  propiedades  se  utilizan  para  obtener  información 
sobre  toda  la  población  a partir  de  información  sobre  una  muestra. 

La  forma  concreta  de  una  distribución  normal  viene  caracterizada  por  dos  pa- 
rámetros: la  media,  p,  que  define  dónde  se  sitúa  el  centro  de  la  función  de  den- 
sidad, y la  desviación  estándar,  a,  que  define  la  amplitud  de  la  función  de 
densidad.  Cuando  una  variable  continua  X sigue  una  distribución  normal,  se 
suele  representar  por  X ~ N (p,  a). 

Las  figuras  22  y 23  muestran,  respectivamente,  la  función  de  densidad  y la 
función  de  distribución  de  una  normal  con  media  p = 250  y desviación  están- 
dar o = 13.  La  figura  24  muestra  las  funciones  de  densidad  para  dos  distribu- 
ciones de  tipo  normal  con  parámetros  |p  = 5,  o = 3¡y{p=10,  ct  = 5¡ 
respectivamente.  Se  observa  que  la  función  de  densidad  de  la  normal  tiene  for- 
ma de  "campana  de  Gauss",  elevada  en  el  centro  (el  valor  medio  o esperado) 
y con  dos  colas  simétricas  en  los  extremos.  Es  de  destacar,  además,  cómo  cada 
una  de  las  curvas  está  centrada  en  su  media,  así  como  el  hecho  de  que  la  curva 
es  más  ancha  cuanto  mayor  es  la  desviación  estándar. 
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Figura  24.  Funciones  de  densidad  asociadas  a sendas  normales 


Función  de  densidad 

Normal 


Como  en  cualquier  otra  función  de  densidad,  el  área  total  encerrada  bajo 
la  curva  es  de  1.  En  la  práctica  eso  significa  que  para  cualquier  valor  x de  X, 
P(X  > x)  = 1 - P(X  < x),  es  decir,  el  área  a la  derecha  de  un  valor  es  el  área 
total  (que  vale  1)  menos  el  área  a su  izquierda  y viceversa  (figura  25).  Ade- 
más, puesto  que  la  normal  es  una  distribución  simétrica  con  respecto  a su 
media,  el  área  "encerrada"  por  una  cola  es  igual  al  área  "encerrada"  por  la 
cola  opuesta  (figura  26). 

Figura  25.  El  área  total  de  una  función  de  densidad  es  1 

Función  de  densidad 

Normal,  media  = 250,  desv.  est.  = 13 


250255 

X 
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Cualquier  distribución  normal  cumple  además  la  llamada  regla  68-95-99,7 
según  la  cual  el  intervalo  (g  - a,  g + a)  contiene  aproximadamente  el  68%  de 
las  observaciones,  el  intervalo  (g  - 2o,  g + 2o)  contiene  aproximadamente  el 
95%  de  las  observaciones  y el  intervalo  (g  - 3o,  g + 3o)  contiene  aproximada- 
mente el  99,7%  de  las  observaciones.  Así,  por  ejemplo,  si  X ~ N (250,13)  se 
puede  afirmar  que  un  68%  de  las  observaciones  de  X estarán  en  el  intervalo 
(237,  263),  un  95%  de  las  observaciones  estarán  en  el  intervalo  (224,  276)  y 
un  99,7%  de  las  observaciones  estarán  en  el  intervalo  (211,  289).  Observad, 
por  tanto,  que  será  altamente  improbable  encontrar  valores  de  X fuera  de  este 
último  intervalo. 

Figura  26.  Dos  colas  simétricas  "encierran"  la  misma  área 

Función  de  densidad 

Normal,  media  = 250,  desv.  est.  = 13 

250 

0,030  - 

0,025  - / \ 

0,020  - / \ 


235  250  265 

X 


De  entre  las  infinitas  distribuciones  normales  que  se  pueden  considerar  va- 
riando los  parámetros  gy  o conviene  citar  la  llamada  normal  estándar,  que 
tiene  por  parámetros  g = 0yc=l.  En  otras  palabras,  una  variable  continua  Z 
se  distribuirá  según  una  normal  estándar,  Z ~N  (0,1),  si  su  función  de  densi- 
dad es  la  de  una  normal  centrada  en  el  origen  y con  desviación  estándar  uni- 
taria. Esta  distribución  normal  estándar  se  suele  usar  bastante  en  estadística 
inferencial  y también  cuando  se  desean  calcular  probabilidades  de  una  normal 
cualquiera  mediante  el  uso  de  tablas  de  probabilidades  ya  calculadas. 

En  efecto,  dada  una  variable  normal  cualquiera,  X ~ N (g,  c>),  es  posible  apli- 
carle un  proceso  de  estandarización  para  obtener  una  normal  estándar  Z. 
Esto  se  consigue  restando  a la  variable  X su  media  g (con  lo  que  la  función 
de  densidad  se  desplaza  a lo  largo  del  eje  x hasta  que  queda  centrada  en  el 
origen)  y dividiendo  el  resultado  por  su  desviación  estándar  a (con  lo  que 
la  nueva  variable  tendrá  una  desviación  estándar  unitaria),  es  decir: 

Z = — — — ~ N(0,1).  Este  proceso  de  estandarización  permite,  entre  otras  co- 

CT 

sas,  calcular  probabilidades  para  una  normal  cualquiera  a partir  de  las  ta- 
blas de  probabilidades  precalculadas  que  existen  para  la  distribución 
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normal  estándar,  lo  que  evita  el  tener  que  resolver  integrales  cada  vez  que 
se  desea  obtener  una  nueva  probabilidad.  Supongamos,  por  ejemplo,  que 
X sigue  una  N(1.500,  100)  y se  desea  obtener  P(X  < 1.400)  mediante  el  uso 
de  tablas.  El  primer  paso  consiste  en  estandarizar  los  valores: 


P(X<  1.400)  = P 


X-x  1.400  - x 
< 


= P Z< 


1.400  - 1.500) 


100 


= P(Z<~  1) 


En  otras  palabras,  se  desea  calcular  el  área  a la  izquierda  del  valor  -1  en  una 
normal  tipificada  o estándar.  Normalmente,  la  tabla  de  la  normal  estándar,  Z, 
ofrece  áreas  (probabilidades)  a la  izquierda  de  valores  positivos,  por  lo  que  re- 
sultará necesario  hacer  una  pequeña  transformación  teniendo  en  cuenta  que: 
(a)  por  simetría  de  la  normal  estándar,  el  área  (probabilidad)  a la  izquierda  de 
un  valor  negativo  k es  igual  al  área  (probabilidad)  a la  derecha  del  correspon- 
diente valor  positivo,  \k\  (p.  ej.,  P(Z  < -1)  = P(Z  > 1)),  y (b)  el  área  (probabilidad) 
total  encerrada  bajo  la  curva  es  1 (p.  ej.,  el  área  a la  izquierda  de  un  valor  más 
el  área  a su  derecha  suma  1,  por  ejemplo:  P{Z  < 1)  + P(Z  > 1)  = 1).  Teniendo  en 
cuenta  lo  anterior,  se  deduce  que  P(Z  < - 1)  = P(Z  > 1)  = 1 - P(Z  < 1)  = ¡ver  tabla 
figura  27}  = 1 - 0,8413  = 0,1587. 

Figura  27.  Cálculo  de  probabilidades  en  una  normal  mediante  tablas 
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Por  otra  parte,  también  es  posible  automatizar  el  cálculo  de  probabilidades  de 
una  normal  cualquiera  mediante  el  uso  de  programas  estadísticos,  con  lo  que 
se  elimina  así  la  necesidad  de  resolver  manualmente  las  integrales  indefinidas 
o de  tener  que  usar  tablas  de  probabilidades  precalculadas.  La  figura  28  mues- 
tra cómo  obtener  probabilidades  de  una  normal  con  Minitab.  En  concreto, 
para  una  normal  con  media  p = 1.500  y desviación  estándar  o = 100,  se  obtiene 
que  P(X  < 1.400)  = 0,158655.  Asimismo,  la  figura  28  muestra  cómo  se  han  ob- 
tenido con  Minitab  y Excel  algunas  probabilidades  para  la  misma  variable.  Es 
preciso  observar  que  P(X  < 1.500)  = 0,5,  lo  cual  es  lógico  puesto  que  1.500  es 
la  media  y,  a la  vez,  la  mediana  de  la  distribución  normal. 


Nota 


Notar  que  para  hallar  P(Z  < 
1,00)  usando  la  tabla  se  ha  de 
buscar  el  valor  intersección  en- 
tre la  fila  1 ,0  y la  columna  0,00 
(dado  que  1,00  = 1,0  + 0,00). 
SI  se  pidiese  P(Z  < 1 ,24),  en- 
tonces habría  que  buscar  la  In- 
tersección entre  la  fila  1 ,2  y la 
columna  0,04  (dado  que  1,24 
= 1,2  + 0,04),  con  lo  que  se  ob- 
tendría el  valor  0,8925. 
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Figura  28.  Cálculo  de  probabilidades  en  una  normal  con  Minitab  y Excel 
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Pasos  a seguir 


Se  sigue  la  ruta  Cale  > Probabi- 
lity Distributions  > Normal  (!)  y 
se  completan  los  parámetros  en 
la  ventana  correspondiente  (2). 
El  resultado  se  muestra  en  (3). 
Observar  que,  si  en  lugar  de  es- 
coger la  opción  Cumulative  pro- 
bability en  (2)  se  hubiera 
escogido  la  opción  Probability 
density,  el  programa  hubiera 
calculado  el  valor  de  la  función 
de  densidad  en  x = 1 .400  en  lu- 
gar de  P(X  < 1 .400).  Finalmen- 
te, para  una  probabilidad  p 
dada,  la  opción  Inverse  cumula- 
tive probability  devuelve  aquel 
valor  c de  la  variable  X tal  que 
P(X<c)  = p. 
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5 

Ejemplos  de  aplicación  de  una  normal 

• Según  un  estudio  realizado  por  el  Ministerio  de  Educación,  el  número  de 
horas  anuales  que  dedican  los  niños  españoles  a ver  la  televisión  es  una  va- 
riable aleatoria  que  sigue  una  distribución  normal  de  media  1.500  horas  y 
desviación  estándar  de  100  horas.  ¿Qué  porcentaje  de  niños  dedican  entre 
1.400  y 1.600  horas  anuales? 

En  este  caso,  X ~ N (1.500,100)  y se  pide  P(1.400  < X < 1.600).  Por  la  regla 
68-95-99,7,  se  tiene  que  la  probabilidad  anterior  será,  aproximadamente,  del 
68%  (ya  que  p - a = 1.400  y p + o = 1.600).  Para  calcular  de  forma  más  exacta 
dicha  probabilidad,  conviene  notar  que  P(1 .400  < X < 1.600)  = P(X  < 1.600) 
- P{X  < 1.400),  es  decir:  el  área  entre  1.400  y 1.600  coincide  con  el  área  a la 
izquierda  de  1.600  menos  el  área  a la  izquierda  de  1.400.  Las  probabilidades 
anteriores  se  pueden  calcular  usando  cualquier  programa  estadístico  (p.  ej.: 
Minitab  o Excel),  y resultan:  P(X  < 1.600)  = 0,8413  y P(X  < 1.400)  = 0,1587, 
por  lo  que  la  probabilidad  buscada  es  de  0,6827,  es  decir,  un  68,27%  de  los 
niños  dedican  entre  1.400  y 1.600  horas  anuales  a ver  la  televisión. 
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• En  base  a los  datos  del  Instituto  Nacional  de  Estadística  (INE),  el  sueldo  me- 
dio anual  de  un  trabajador  es  de  26.362  euros.  Suponiendo  que  dichos  suel- 
dos sigan  una  distribución  normal  con  una  desviación  estándar  de  6.500 
euros,  ¿cuál  será  el  porcentaje  de  trabajadores  que  superen  los  40.000  euros? 

En  este  caso,  X ~ N (26.362,6.500)  y se  pide  P(X  > 40.000).  Observar  que, 
puesto  que  el  área  total  bajo  la  curva  normal  es  1,  P(X  > 40.000)  = 1 - P(X 
< 40.000)  = {Minitab  o Excel)  = 1 - 0,9821  = 0,0179,  es  decir,  sólo  un  1,8% 
de  los  trabajadores  superarían  la  cifra  de  los  40.000  euros  anuales. 

• El  tiempo  que  se  emplea  en  rellenar  un  cuestionario  en  línea  sigue  una  dis- 
tribución aproximadamente  normal  con  una  media  de  3, 7 minutos  y una 
desviación  estándar  de  1,4  minutos.  ¿Cuál  es  la  probabilidad  de  que  se  tar- 
de menos  de  2 minutos  en  responder  a dicho  cuestionario?  ¿Y  de  que  se 
tarde  más  de  6 minutos?  Hallad  el  valor  c tal  que  P(X  <c)  =0,75  (percentil 
75  de  la  variable). 

En  este  caso,  X ~ N (3,7,  1,4).  En  primer  lugar,  P(X  < 2)  = {Minitab  o Excel) 
= 0,1131,  es  decir:  un  11,31%  de  los  individuos  que  respondan  el  cuestio- 
nario emplearan  menos  de  2 minutos  en  hacerlo.  Por  otra  parte,  P(X  > 6)  = 
1 - P(X  < 6)  = {Minitab  o Excel)  = 0,0505,  es  decir,  un  5%  de  los  individuos 
tardarán  más  de  6 minutos  en  responder  el  cuestionario.  Finalmente,  para 
hallar  el  valor  c tal  que  P(X  < c)  = 0,75  se  debe  usar  la  opción  Inverse  cnmu- 
lative  probability  de  Minitab  (o  su  equivalente  en  Excel),  con  lo  que  se  ob- 
tiene un  valor  aproximado  de  4,64  minutos,  es  decir  el  75%  de  los 
individuos  tardan  menos  de  4,64  minutos  en  completar  el  cuestionario  (o, 
dicho  de  otro  modo,  el  25%  tardan  más  de  4,64  minutos  en  hacerlo). 

Las  distribuciones  f-Student  y F-Snedecor 

Además  de  la  normal,  hay  muchas  otras  distribuciones  de  probabilidad  conti- 
nuas que  se  suelen  usar  en  estadística  inferencial.  Una  de  ellas  es  la  llamada 
distribución  í-Student,  y otra  es  la  llamada  f-Snedecoi  . Ambas  se  presentan  a 
continuación: 

La  distribución  í-Student  es  una  distribución  simétrica  y centrada  en  el  origen 
(es  decir,  su  media  y su  mediana  son  0).  Esta  distribución  se  caracteriza  por  un 
parámetro  llamado  grados  de  libertad  o df(degrees  offreedom),  siendo  df>  2. 
En  la  práctica,  df=n  - 1,  donde  n es  el  tamaño  de  la  muestra  que  se  esté  ana- 
lizando. La  figura  29  muestra  diversas  funciones  de  densidad  de  las  í-Student, 
cada  una  de  ellas  asociadas  a un  valor  concreto  del  parámetro  df.  Se  observa 
cómo  la  í-Student  se  asemeja  cada  vez  más  a una  normal  estándar  conforme 
se  va  incrementando  el  parámetro  grados  de  libertad. 

Grados  de  libertad 

En  estadística,  el  concepto  de  grados  de  libertad  asociados  a un  conjunto  de  datos  se  puede 
interpretar  como  el  número  mínimo  de  valores  que  se  necesitaría  conocer  para  detemiinar 
dichos  datos.  Así,  por  ejemplo,  en  el  caso  de  un  muestra  aleatoria  de  tamaño  N,  habría  N gra- 
dos de  libertad  (no  se  puede  determinar  el  valor  de  ninguno  de  los  datos  incluso  aunque  se 
conociese  el  valor  de  los  N-  1 restantes).  Sin  embargo,  un  conjunto  de  N datos  de  los  cuales 
se  conozcan  N - 1,  la  media  muestral  tendría  N - 1 grados  de  ¡ibertad  (fijados  los  valores  de 
los  N- 1 datos  y de  la  media,  quedaría  ya  fijado  el  valor  desconocido  restante).  Así,  si  tenemos 
un  conjunto  de  3 observaciones  de  la  variable  X,  X\  = 2,  x2  = -2  y a3  = a (desconocido),  y sa- 
bemos que  la  media  de  los  tres  valores  es  0,  necesariamente  a = 0. 
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Figura  29.  Funciones  de  densidad  de  í-Student  según  df 


Funciones  de  densidad  para  t-Student  (3),  t-Student  (10)  y N(0,1) 


Por  su  parte,  la  distribución  F-Snedecor  es  otra  distribución  continua.  La 
F-Snedecor  siempre  toma  valores  no  negativos  (es  decir,  una  variable  que  siga 
dicha  distribución  sólo  puede  tomar  valores  iguales  o mayores  a 0,  nunca  va- 
lores negativos).  Además,  esta  distribución  no  es  simétrica,  sino  que  está  ses- 
gada a la  derecha  (figura  30).  Así  como  la  normal  venía  caracterizada  por  dos 
parámetros,  p (media)  y a (desviación  estándar),  la  F-Snedecor  también  se  ca- 
racteriza por  dos  parámetros:  los  grados  de  libertad  del  numerador,  df  1 y los 
grados  de  libertad  del  denominador,  df  2.  Al  igual  que  ocurría  con  la  f-Stu- 
dent,  para  cada  valor  de  estos  parámetros  se  obtiene  una  función  de  densidad 
distinta  y,  por  tanto,  una  distribución  F-Snedecor  distinta. 

Figura  30.  Funciones  de  densidad  de  t-Student  según  df\  y df 2 


Funciones  de  densidad  para  varias  F-Snedecor 

F 


X 
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Para  calcular  probabilidades  asociadas  a una  f-Student  o a una  F-Snedecor, 
pueden  usarse  programas  estadísticos  o de  análisis  de  datos  (Minitab,  Excel, 
etc.)  de  forma  análoga  a como  se  hacía  en  el  caso  de  la  normal.  Así,  por  ejem- 
plo, si  X es  una  variable  aleatoria  que  sigue  una  distribución  t-Student  con  diez 
grados  de  libertad,  P(- 1,74  < X < 1,74)  = P(X  < 1,74)  - P(X  < -1,74)  = ¡Minitab 
o Excel)  = 0,9438  - 0,0562  = 0,8876  (figura  31). 

Figura  31.  Probabilidades  en  una  í-Student 


P(- 1,74)  < X<  1,74) 

T,  dl=  10 


-1,74  0 1,74 

X 


Finalmente,  si  X es  una  variable  aleatoria  que  sigue  una  distribución  F-Snede- 
cor  con  nueve  grados  de  libertad  en  el  numerador  y siete  grados  de  libertad  en 
el  denominador,  entonces  P(X  > 2,5)  = 1 - P(X  < 2,5)  = ¡Minitab  o Excel)  = 1 - 
0,8797  = 0,1203  (figura  32). 

Figura  32.  Probabilidades  en  una  F-Snedecor 
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Nota 


Notar  que  P(-1,74  < X<  1,74) 
viene  representada  por  el  área 
marcada  en  la  figura  31 
(esto  es,  el  área  comprendida 
entre  los  valores  -1,74  y 1,74). 
Para  calcular  dicha  área,  se  cal- 
cula P(X  < 1,74)  (p.  ej.,  el  área 
a la  izquierda  del  1,74)  y 
al  valor  obtenido  se  le  resta 
P(X  < —1 , 74)  (p.  ej.,  el  área 
a la  izquierda  del  -1,74).  Para 
calcular  P(X  < 1,74)  con  Mini- 
tab se  usa  el  menú  Calo 
Probabillty  Distríbutions  > t. . 
especificando  los  grados  de  li- 
bertad (10  en  este  ejemplo) 
y el  valor  de  la  constante  (1,74 
en  este  caso).  Análogamente 
se  obtendría  el  valor  de 
P(X  < -1,74). 


Nota 


De  forma  análoga  a como 
ocurría  en  el  caso  de  las  distri- 
buciones binomial  y normal, 
también  existen  tablas  que 
permiten  calcular,  sin  necesi- 
dad de  utilizar  software 
como  Minitab  o Excel,  las  pro- 
babilidades asociadas  a una 
distribución  t-Student  o 
F-Snedecor  (ver,  p.  ej., 
http://www.statsoft.com/ 
textbook/distribution-tables). 
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Resumen 


En  este  módulo  se  han  presentado  las  técnicas  básicas  de  la  estadística  descrip- 
tiva univariante:  representación  gráfica  de  datos  discretos  y continuos,  orga- 
nización de  los  datos  mediante  tablas  de  frecuencias  y uso  de  estadísticos 
descriptivos  para  resumir  datos.  Conviene  recordar  que  el  tipo  de  gráfico,  tabla 
o estadístico  a usar  dependerá  siempre  del  tipo  de  variable  considerada  (cate- 
górica, cuantitativa  discreta  o cuantitativa  continua),  así  como  del  tipo  de  in- 
formación que  se  desee  obtener. 

Además,  se  ha  explicado  también  el  concepto  de  probabilidad  de  un  suceso, 
que  desempeña  una  función  relevante  en  el  análisis  y predicción  del  compor- 
tamiento de  las  variables  aleatorias  asociadas  a fenómenos  cotidianos. 

Finalmente,  se  han  presentado  algunos  de  los  principales  modelos  matemáticos 
que  se  usan  para  describir,  de  forma  teórica,  el  comportamiento  de  variables 
aleatorias:  la  distribución  binomial,  la  normal,  la  f-Student  y la  F-Snedecor  son 
algunos  ejemplos  de  dichos  modelos.  El  cálculo  de  probabilidades  asociadas  a va- 
riables que  se  comportan  según  alguno  de  estos  modelos  permite  entender  mejor 
su  comportamiento  y realizar  estimaciones  sobre  la  población  de  individuos  de  la 
que  provienen  los  datos. 
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Ejercicios  de  autoe valuación 

1)  La  tabla  siguiente  resume  las  respuestas  ofrecidas  por  doscientos  usuarios  de  un  portal  web 
a la  pregunta  "el  nivel  de  usabilidad  del  portal  es  adecuado": 


Respuesta 

Frecuencia 

Totalmente  de  acuerdo 

50 

De  acuerdo 

75 

Ligeramente  de  acuerdo 

25 

Ligeramente  en  desacuerdo 

15 

En  desacuerdo 

15 

Totalmente  en  desacuerdo 

20 

Se  pide  que  hagáis  lo  siguiente: 

a)  Construir  un  diagrama  de  barras  que  permita  visualizar  las  respuestas  obtenidas. 

b)  Calcular  la  frecuencia  relativa  de  aparición  de  cada  respuesta  y construir  un  diagrama  cir- 
cular para  ilustrar  dichos  valores. 

2)  La  tabla  siguiente  contiene  cuarenta  observaciones  para  el  tiempo  transcurrido  (en  horas) 
entre  el  envío  de  un  mensaje  a un  foro  en  línea  y su  correspondiente  respuesta. 


4,0 

3,5 

3,1 

6,0 

5,6 

3,1 

2,9 

3,8 

4,3 

3,8 

4,5 

3,5 

4,5 

6,1 

2,8 

5,0 

5,4 

3,8 

6,8 

4,9 

3,6 

3,6 

3,8 

3,7 

4,1 

2,0 

3,7 

5,7 

7,8 

4,6 

4,8 

2,8 

5,0 

5,2 

4,0 

5,4 

4,6 

3,8 

4,0 

2,9 

A partir  de  estos  datos,  debéis  hacer  lo  siguiente: 

a)  Construir  un  diagrama  de  tallos  y hojas.  Usad  1,0  como  unidad  de  incremento. 

b)  Construir  un  histograma. 

c)  ¿Se  observa  en  los  datos  algún  patrón  claro?  ¿Cuál  es  la  moda  de  la  distribución  de  los  da- 
tos? 

3)  La  tabla  siguiente  muestra  veinte  observaciones  de  la  variable  aleatoria  "número  de  co- 
rreos electrónicos  recibidos  en  un  día". 


3,9 

3,4 

5,1 

2,7 

4,4 

7,0 

5,6 

2,6 

4,8 

5,6 

7,0 

4,8 

5,0 

6,8 

4,8 

3,7 

5,8 

3,6 

4,0 

5,6 

Se  pide  que  hagáis  lo  siguiente: 

a)  Hallar  los  estadísticos  descriptivos  de  esta  muestra.  ¿Cuánto  vale  el  rango  intercuartílico? 
¿Entre  qué  dos  valores  están  comprendidos  el  50%  de  los  datos  centrales  de  la  muestra? 

b)  Construir  un  diagrama  de  cajas  y bigotes  (boxplot).  ¿Hay  algún  valor  anómalo  ( outlier ) en- 
tre las  observaciones? 

4)  Cuando  se  efectúa  un  control  antidopaje  a un  atleta  que  no  ha  tomado  sustancia  alguna, 
la  probabilidad  de  que  el  test  dé  un  falso  positivo  es  de  0,006.  Si  durante  una  competición  se 
efectúa  el  test  a un  total  de  1.000  atletas  que  están  libres  de  sustancias,  ¿cuál  será  el  número 
esperado  (promedio)  de  falsos  positivos?,  ¿cuál  es  la  probabilidad  de  que  el  número  de  falsos 
positivos  sea  superior  a quince?,  ¿qué  cabría  pensar  si  aparecen  más  de  quince  positivos? 

5)  De  acuerdo  con  el  Instituto  Nacional  de  Estadística,  el  9,96%  de  los  adultos  residentes  en 
España  son  extranjeros.  Con  el  fin  de  realizar  una  encuesta,  se  pretende  contactar  con  una 
muestra  aleatoria  de  mil  doscientos  adultos  residentes  en  España.  ¿Cuál  será  el  número  espe- 


CC-BY-SA  • PID_001 61 058 


48 


rado  (promedio)  de  extranjeros  que  contendrá  dicha  muestra?,  ¿cuál  es  la  probabilidad  de 
que  la  muestra  contenga  menos  de  cien  extranjeros? 

6)  El  tiempo  de  duración  de  un  embarazo  es  una  variable  aleatoria  que  se  distribuye  de  forma 
aproximadamente  normal  con  una  media  de  doscientos  sesenta  y seis  días  y una  desviación 
estándar  de  dieciséis  días.  ¿Qué  porcentaje  de  embarazos  duran  menos  de  doscientos  cuaren- 
ta días  (unos  ocho  meses)?,  ¿qué  porcentaje  de  embarazos  duran  entre  doscientos  cuarenta 
y doscientos  setenta  días  (entre  unos  ocho  y nueve  meses)?,  ¿a  partir  de  cuántos  días  se  sitúan 
el  20%  de  los  embarazos  más  largos? 
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Solucionarlo 

i) 


a) 


Adecuación  de  la  usabilidad  del  portal 


b) 


Respuesta 

Frecuencia 

Frec.  relativa 

Totalmente  de  acuerdo 

50 

25,0% 

De  acuerdo 

75 

37,5% 

Ligeramente  de  acuerdo 

25 

1 2,5% 

Ligeramente  en  desacuerdo 

15 

7,5% 

En  desacuerdo 

15 

7,5% 

Totalmente  en  desacuerdo 

20 

1 0,0% 

Totales 

200 

100% 

Adecuación  de  la  usabilidad  del  portal 

Totalmente  desacuerdo 
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2) 


a) 


Stem-and-Leaf  Display:  precios 

Stem-and- 

-leaf  of  precios  N = 40 

Leaf  Unit  = 0.10 

5 2 

08899 

18  3 

1155667788888 

(11)  4 

00013556689 

11  5 

0024467 

4 6 

018 

1 7 

8 

b) 


Histograma  de  precios 


2 3 4 5 6 7 8 


Precios 


c)  Aunque  no  parece  haber  ningún  patrón  claro  en  los  datos,  sí  se  aprecia  -tanto  en  el  histo- 
grama como  en  el  gráfico  de  tallos  y hojas-  una  cierta  forma  de  campana,  con  la  parte  central 
más  elevada  y unos  extremos  o colas  más  bajas.  La  moda  de  este  conjunto  de  datos  es  3,8  ya 
que,  como  se  aprecia  en  el  diagrama  de  tallos  y hojas,  es  el  valor  que  más  aparece. 

3) 


a) 


Descriptive  Statistícs:  N 

e-maíls 

Variable 

N N*  Mean 

SE  Mean 

StDev  Minimum 

Q1 

Median  Q3 

N_e-mails 

20  0 4.810 

0.291 

1.302  2.600 

3.750 

4.800  5.600 

Variable 

Máximum 

N_e-mails 

7.000 

El  rango  intercuartílico  es  Q3  - Q1  = 5,60  - 3,75  = 1,85.  Entre  Q1  = 3,75  y Q3  = 5,60  están 
comprendidos  el  50%  de  los  datos  centrales. 
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b) 


Boxplot  of  N correos  electrónicos 


71 


5 1 


4l 


3 


2-1 


No  se  observa,  en  este  caso,  ningún  valor  anómalo  (outlier),  ya  que  el  gráfico  no  muestra  nin- 
gún símbolo 

4)  En  este  caso,  puesto  que  el  resultado  de  cada  test  puede  ser  "positivo"  (con  probabilidad  0,006) 
o "no  positivo"  (con  probabilidad  1 - 0,006  = 0,994),  la  variable  aleatoria  X = "número  de  falsos 
positivos  en  1.000  pruebas  a atletas  limpios"  sigue  una  distribución  binomial  de  paráme- 
tros n = 1.000  y p = 0,006.  En  el  caso  de  la  binomial,  la  media  o valor  esperado  es  p = n ■ p = 6,  es 
decir,  cabe  esperar  que  al  aplicar  el  test  a 1.000  atletas  "limpios”  haya  seis  falsos  positivos. 

Por  otra  parte,  P(X  > 15)  = 1 - P(X  <=  15)  = |Minitab  o Excel)  = 1 - 0,9995  = 0,0005.  Por  tanto,  si 
aparecen  más  de  quince  positivos  cabría  pensar  que  muy  probablemente  no  todos  ellos  sean  fal- 
sos. 

5)  En  este  caso,  la  variable  aleatoria  X = "número  de  extranjeros  en  la  muestra"  sigue  una 
distribución  binomial  de  parámetros  n = 1.200  y p = 0,0996.  Por  tanto,  el  valor  esperado  de 
extranjeros  en  la  muestra  es  p = n ■ p = 119,52,  es  decir  el  promedio  de  extranjeros  para  las 
muestras  de  esas  características  es  de,  aproximadamente,  120. 

Por  otro  lado,  P(X  < 100)  = P(X  <=  99)  = {Minitab  o Excel)  = 0,0245,  es  decir,  es  muy  poco 
probable  que  una  muestra  contenga  menos  de  100  extranjeros  si  ésta  es  realmente  aleatoria. 

6)  Se  considera  la  variable  aleatoria  X = "días  que  dura  un  embarazo".  Cabe  tener  en  cuenta 
queX~N  (266,16). 

P(X  < 240)  = jMinitab  o Excel)  = 0,0521,  es  decir,  el  5,2%  de  los  embarazos  duran  menos  de 
ocho  meses. 

P(240  < X < 270)  = P(X  < 270)  - P(X  < 240)  = jMinitab  o Excel)  = 0,5987  - 0,0521  = 0,5466, 
es  decir,  el  55%  de  los  embarazos  duran  entre  ocho  y nueve  meses. 

Finalmente,  se  pide  el  valor  c tal  que  P(X  > c)  = 0,20,  es  decir:  P(X  < c)  = 1 - P(X  > c)  = 0,80 
c = jMinitab  o Excel)  = 279,47,  es  decir,  el  20%  de  los  embarazos  supera  los  doscientos  setenta 
y nueve  días. 


